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Prólogo 


El álgebra de matrices es en la actualidad un elemento esencial de los 
conocimientos matemáticos necesarios para ingenieros y científicos. Ade- 
más, la comprensión de los métodos fundamentales del álgebra matricial 
es apropiada para sociólogos, economistas, estudiantes de pedagogía y de 
comercio. 

A pesar de las diversas aplicaciones del álgebra matricial, la mayoría 
de textos de álgebra lineal no introducen estos temas, por eso en mu- 
chos casos no se encuentra un libro que se ajuste a los requerimientos y 
necesidades de ciertas materias. Estas notas de clase están basadas en el 
curso de álgebra matricial de la carrera de Estadística, las cuales han sido 
redactadas usando diferentes textos, resaltando principalmente los libros 
referenciados en la bibliografía como Apostol (1985), Asmar (1995), Bar- 
bolla £z Sanz (1998), Bru et al. (2001), Graybill (1983), Schott (1997) 
y Searle (1982). 

Este texto sirve de ayuda para aquellos estudiantes que toman diversas 
asignaturas en las cuales deben tener o les serían útiles los conocimientos 
del álgebra de matrices. Aunque en estas circunstancias siempre es inade- 
cuado comenzar un curso de teoría de matrices, estas notas le permitirán 
al lector adquirir la práctica necesaria en el manejo de matrices. 

El objetivo principal de estas notas consiste en capacitar al lector para 
que adquiera la habilidad de usar el álgebra de matrices en diferentes ám- 
bitos, proporcionando conceptos como la diagonalización y factorización 
matricial, formas cuadráticas e inversas generalizadas de una manera sen- 
cilla; durante su desarrollo, se plantean ejemplos y ejercicios relacionados 
con la teoría. 

Este material está escrito en forma secuencial, pues los contenidos pre- 
vios son importantes para tener una mejor comprensión del desarrollo de 
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cada sección posterior, lo cual ayudará al lector a alcanzar su principal ob- 
jetivo. Asimismo, proporciona un medio individual para estudiar el tema 
expuesto y es muy práctico como texto autodidáctico. Además, permitirá 
que el lector avance a su propio ritmo. De esta manera, este material 
puede ser usado por estudiantes con diferentes aptitudes, conocimientos 
y velocidades de lectura. 

Espero que este material carezca de errores, sin embargo, “no importa 
el cuidado que se ponga, siempre se comete algún error” (Ley de Murphy). 
Por lo tanto, los errores que posea deseo conocerlos para poderlos corregir, 
en una próxima edición. Esta es tal vez la única forma de avanzar en un 
ambiente académico. 

Agradezco la colaboración del Departamento de Matemáticas, que a 
través de su oficina de publicaciones me permitió la divulgación de este 
material. También quiero dar las gracias tanto a los colegas que evalua- 
ron este manuscrito, en especial al profesor Leonardo Solanilla Chavarro, 
como a mis estudiantes del curso de Álgebra Matricial de la carrera de 
Estadística, por sus sugerencias y comentarios, los cuales fueron muy 
útiles en la redacción de este material. Adicionalmente, quiero agradecer 
al equipo editorial de la Universidad Nacional de Colombia, sede Bogotá, 
por la corrección de estilo. 


José Alfredo Jiménez M. 


Capítulo 1 


Preliminares 


Este capítulo es una recopilación de conceptos, procedimientos y resulta- 
dos básicos que, por lo general, forman parte del primer curso de álgebra 
lineal. Por consiguiente, una gran parte de estos resultados aparecen sin 
prueba; además, en algunos casos se consideran temas que el lector debe 
manejar y que por su importancia son retomados posteriormente. 


El propósito fundamental de este material es servir como prerrequi- 
sito para los siguientes capítulos y, como ya se mencionó, no se pro- 
fundizará en los temas considerados en este capítulo. Si el lector tiene 
amplios conocimientos del contenido de este apartado, puede pasar de 
inmediato al siguiente capítulo, aunque es recomendable que desarrolle 
las Secciones 1.5 y 1.9. 


1.1 Matrices 


En esta sección se introducen los conceptos y las reglas básicas del álgebra 
de matrices. Entre los diferentes elementos estudiados por el álgebra line- 
al, uno de los más utilizados es el de matriz. Esto se debe a que la teoría 
de matrices ofrece, entre otras, la posibilidad de trabajar cómodamente 
con modelos de gran dimensión, tanto en número de variables, como de 
ecuaciones o datos, ya que brinda una notación simple y compacta para 
designar amplios conjuntos de información. 
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1.1.1 Conceptos básicos 

En este apartado se presenta la definición formal del término matriz. Las 
matrices se denotan con letras mayúsculas y con minúsculas, los elementos 
que las constituyen. 

Definición 1.1 Una matriz A de tamaño mxmn es un arreglo rectangular 


de m-n números reales (o complejos! ) dispuestos en m filas y n columnas, 


escritos entre corchetes (o paréntesis), como sigue: 


011 012 Ea 015 Es ln 
A Qí1 052 Qi; Qin | > 
[am m2 ... mp +... mn 


donde los subíndices indican la “fila” y la “columna” de localización en la 
matriz de cada número real (o complejo). A los números 411,412,...,Umn 
se les llama elementos o entradas de la matriz. 


Observación 

Cuando m = n, la matriz recibe el nombre de cuadrada; si es m £ n, 
se denomina rectangular. Al conjunto de todas las matrices de tamaño 
m Xx n se le notará por Min. 


Definición 1.2 Matrices iguales 
Sean las matrices reales A = la¡¡] y B = (b;5], se dice que son iguales 


cuando teniendo el mismo tamaño, se verifica que 


YVi=1,2,...,m; 
ai =0di y 
j=1,2,...,n. 


1 Si el lector no está familiarizado con estos números, puede consultar el 
Apéndice B. 
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1.1.2 Operaciones con matrices 


En esta sección se consideran las operaciones con matrices; además, se 
recuerda que solo se pueden sumar matrices que tienen el mismo tamaño, 
y para que el producto sea posible, es preciso que el número de columnas 
de la primera matriz coincida con el número de filas de la segunda. 


Definición 1.3 Dadas A = [a;¿] y B = (b;5], matrices de tamaño m x n, 


la suma A+ B es una matriz C = [c;¡] de tamaño m x n, donde 
Cij = ij + dsj A A A 


Teorema 1.1 Propiedades básicas de la suma 


Para todas A, B y C matrices de tamaño m xn, se verifica que 
1 Conmutativa: A+ B=B+A. 
2 Asociativa: (A + B) +0O=A+ (B + C). 


3 Existencia de elemento neutro o matriz nula: Existe una matriz O 
de tamaño m x n en donde todos sus elementos son iguales a cero, 


tal que VA de tamaño m x n, se verifica que 


A+O=0+4=A. 


4 Elemento opuesto: Para toda matriz A de tamaño mx n, existe una 
matriz que llamaremos matriz opuesta de A y denotaremos por —A, 


que verifica 


A+ (-4)=0. 
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La última propiedad permite, dadas dos matrices A = (a;¿] y B = [b;¿] del 
mismo tamaño m x n, introducir el concepto de matriz diferencia A— B, 
la cual puede ser definida como sigue: 


A—-B=A+(-B). 


Demostración. 
Sean A = la;¿], B = [bi5] y C = [cs]. 


1. 05 + Dig = dig + Qsj- 

2. (aj; + bj) + Ci = 0i5 + (Dj + Cij)- 

3. Es evidente que, para toda A de tamaño m x n, se verifica que 
Gi H0=0+ 55 = Mgj- 

4. Al tomar —A = [-aj¡], se verifica que 


ai; + (+05) = (045) +01 =0. 1 


Definición 1.4 El producto de una matriz A = la;¡] de tamaño m x n 
por un escalar a € R es una matriz C = [c;¿] del mismo tamaño que A, 


de elementos 
Cij — QO5¿ A e ll A A 


esto es, los elementos de C' se obtienen multiplicando los elementos co- 
rrespondientes de A por a. 


El resultado de efectuar el producto de una matriz A por un escalar q se 
simboliza por a. A y se lee multiplicación de A por a. 


Teorema 1.2 Propiedades de la multiplicación por un escalar 
Para todas A y B de tamaño mx n y a, BER, se satisface que 
a) A(A+B) =0A+aB, b) (a+ B)A=0a4+B4, 


c) a(B4) = (aB)A, d) 14=A. 
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Demostración. 
Sean A = [a;¿] y B = lb;¡], entonces 


a) a(A+B) = a [a¡; + bi,] = a [a¡¿] + a [b;;). 
») (a+8)A= (a+ 5) la;¡] =a [ai;] + 8 las) 
c) a(BA) = a(8 [a;;]) = (08) [as] - 
dda=1]=W) 


Definición 1.5 Matriz identidad 


Una matriz A = [a;¿] de tamaño n x n cuyos elementos son 


l sii=j 
Qij = 
0 sinif%j 
se llama matriz identidad y se denota por L,,. 


Definición 1.6 Sean A = [a;¿] y B = [b;x] matrices de tamaño m x n 
y nx op, respectivamente. Entonces el producto de las matrices A y B, 
operación que se denotará por A.B, es una matriz € de tamaño m X p, 
cuyo elemento genérico Cix (i=1,2,...,m;k=1,2,...,p) es 
n 
Cik = Qj1b1g + Or2b2 +... + Aindnk = yn Aijb;k.. 
j=1 

Teorema 1.3 Propiedades del producto de matrices 

Sean A, B,C y D matrices reales tales que A € Mmm, B,C € Mnp Y 


D € Mpq- Entonces se satisface que 
1. Asociativa: A.(B.D) = (4.B).D. 
2. Distributiva: 


a) A(B+C0)=A.B+AC  b)(B+C)D=B.D+C.D. 
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3. El producto por una matriz nula O del tamaño adecuado es una 


matriz nula. 


4. En general, esta operación matricial no es conmutativa: 


A.B 4 B.A. 


5. Existen matrices l,, e 1, tales que 


Ta A = A y AN, =de 


Demostración. 
Queda como ejercicio para el lector. M 


Definición 1.7 Transpuesta 
Si A = [a;¿] es una matriz real de tamaño mx n, se llama transpuesta 
de A a la matriz B = [b;¡] de tamaño n x m cuyo elemento b;¿= aji. Se 


denota por A!. 


Teorema 1.4 Propiedades de la transpuesta 
Sean A y B matrices de tamaño m x n, C” una matriz de tamaño 


n xm y sea au ER. Entonces 


1. (49"=A, 2. (AB) =4'+B%, 
3. (04) =04!. 4. (AC) =C*A?, 
Demostración. 


Queda como ejercicio para el lector. M 
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1.1.3 Operaciones elementales sobre los renglones 


Sea A una matriz real de tamaño m x n, entonces las operaciones ele- 
mentales en las filas de la matriz son: 


Ri Multiplicar cada elemento de la ¿-ésima fila por un escalar a 4 0. 
R2 Sumar a la ¿-ésima fila un múltiplo de la k-ésima fila. 
R3 Intercambiar (permutar) dos filas. 


Y las operaciones elementales en las columnas de la matriz son: 


C1 Multiplicar cada elemento de la j-ésima columna por un escalar 
aF0. 


C3 Sumar a la j-ésima columna un múltiplo de la l-ésima columna. 


C3 Intercambiar (permutar) dos columnas. 


Definición 1.8 Matrices elementales 
Una matriz Exz (a) de tamaño mx m se llama matriz elemental si es 
el resultado de aplicar una operación elemental a la matriz identidad I,. 


Realizar una operación elemental en una fila (o columna) de una matriz 
A es equivalente a premultiplicar (o multiplicar) a A, respectivamente, 
por la matriz elemental adecuada. Esto se tiene de la definición de mul- 
tiplicación de matrices, la cual nos aclaró el hecho de que premultiplicar 
(o multiplicar) una matriz A por una matriz elemental daba el mismo 
resultado que aplicar la operación elemental a la fila correspondiente de 
la matriz A. 


Notación 
La notación que se usará para los tres tipos de operaciones R1, Ra y 
R3 con matrices elementales es la siguiente: 


e La matriz elemental tipo R¡ es una matriz Ena) = [2454), cuyos 
elementos son 


losii=jXk, 
Vii =, a sii=j=k, 
= lo siiZj 


Nótese que es una matriz diagonal. 
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e La matriz elemental tipo Ra es una matriz En (a) [1,5] E 


l sii=3J, 
Vij = a sii=k,j=1l, 


ESl 
de O en otro caso. 


Esta matriz es triangular superior (inferior) dependiendo de la re- 
lación de orden que exista entre r y s. Además, si k = l coincide 


con la matriz elemental tipo Rj. 


e Matriz elemental tipo R3 es una matriz En (1) = [Dig]: 


1 sii=jiX4kiXl, 
A lit=khi=kh 
A E A 
0 


en otro caso. 


Definición 1.9 Matriz escalonada 
Se dice que una matriz es escalonada si el número de ceros que precede 
al primer elemento diferente de cero de una fila aumenta fila por fila hasta 


tener posiblemente filas de solo ceros. 


Definición 1.10 Forma escalonada reducida 
Una matriz se dice que es escalonada reducida si verifica las siguientes 


condiciones: 


1. Es una matriz escalonada. 


ii. El primer elemento no nulo (por la izquierda) de cada fila no nula es 
un 1 y este es el único elemento diferente de cero que se encuentra 


en la respectiva columna. 


11. Las filas nulas, si existen, están en la parte inferior de la matriz. 
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1.1.4 Traza de una matriz 


En esta sección se estudiará una característica de las matrices cuadradas, 
la cual se expresa a través de un número llamado traza. 


Definición 1.11 Traza de una matriz 
Sea A = [a;¡] una matriz real de tamaño n x n, la suma de los ele- 
mentos de la diagonal principal se llama traza de A y se denota como 


tr(A), o sea 


n 
tr(A) = y Oi. (1.1) 
¿=1 
Teorema 1.5 Propiedades 


1. tr(L,) =n, siendo 1,, la matriz identidad de tamaño n x n. 


2. tr(O) =0 siendo O la matriz nula de tamaño n x n. 


3. tr(4) =11(49). 


5. tr(aA) = atr(A), con a ER. 

6. Si A y B son del mismo tamaño, tr(A + B) =tr(A) +tr(B). 

7. Si son posibles los productos A.B y B.A, entonces se verifica 
tr(A.B) =tr(B.A). 


8. tr(A.X) =0, para toda X € Man, implica que A= O. 


Demostración. 
Queda como ejercicio para el lector. M 
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1.2 Inversa de una matriz 
Es sabido que todo número a % 0 tiene un inverso a”! tal que 
QQ =a a=1. (1,2) 


Este hecho permite resolver las ecuaciones del tipo qx = BP, ya que mul- 
tiplicando por a7! se obtiene x =07!B. 

En este apartado se define un tipo de matriz que tiene una propiedad 
análoga en la teoría de matrices, la matriz inversa. 
Definición 1.12 Inversa de una matriz 


Sea A una matriz real de tamaño n x n, si existe una matriz real B 


de tamaño n Xx n tal que 
A.B=B.A= lp. (1.3) 


Entonces B se denota por A7! y recibe el nombre de matriz inversa. 


Notación 

Si A tiene inversa, entonces A se llama matriz no singular o invertible; 
en cambio, si A no tiene inversa, entonces A se llama matriz singular o 
no invertible. 


1.2.1 Método de Gauss-Jordan para calcular la inversa 


Para encontrar la inversa de una matriz cuadrada A de tamaño n x n, se 
procede de la siguiente manera: 


1. Se forma la matriz aumentada B = (A] La) de tamaño n x 2n. 


2. Se aplican operaciones elementales entre filas hasta llevar a B a una 
matriz escalonada reducida € = (Aj | A)). 


3. Se decide si Á es no singular. 


a. Si A1 = [,, entonces Ay = 47?,. 


b. Si A¡ X [,,, entonces A: tiene una fila de ceros. En este caso, 
A es singular, es decir 47! no existe. 
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Teorema 1.6 Propiedades de la inversa de una matriz 
1. Si una matriz A tiene inversa, esta es única. 


2. La inversa del producto de un escalar no nulo por una matriz es el 
producto del inverso multiplicativo del escalar por la inversa de la 


matriz. En símbolos, 
(0.4) =-A*”, con 0ER, a 0. 
Q 


3. La inversa de la inversa es la matriz original. En símbolos, 
(AD =A. 


4. La inversa de una matriz transpuesta es la transpuesta de la inversa. 


En símbolos, 
(47 (47), 


5. Si A y B son dos matrices invertibles y del mismo tamaño, el pro- 


ducto A.B es invertible y, además, 
AB =aar, 
0) [4.83] = (4) (8)7. 
6. Si A es una matriz invertible, 
a) BA=0 > B=0. 


bd) B.A =C.A > B=C. 


Demostración. 
Queda como ejercicio para el lector. M 
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1.3 Determinantes 


Los determinantes permiten determinar cuando una matriz cuadrada es 
invertible. Un determinante de n-ésimo orden es una expresión asociada 
con una matriz A = [a;¡] de tamaño n x n, como se explica a continuación 
empezando con n = 2. 


Definición 1.13 Sea A = [a;¿] una matriz de tamaño 2 x 2. Entonces, 


el determinante de A se define por 


det A = 011.092 — 0192.091- (1.4) 
Con frecuencia, se denotará el det A por 


a411 012 


Al o 
21 022 


aquí se usan barras (mientras que una matriz tiene corchetes). 


Definición 1.14 Sea A = [a;¿] una matriz de tamaño 3 x 3. Entonces, 
el determinante de A se puede escribir en términos de los determinantes 


de matrices 2 x 2, como sigue: 


qa22 023 qa21 023 a21 022 
det A = a31. — 012. + 013. (LA 


a32 033 431 033 a31 032 
o en la forma explícita siguiente: 


4] = az, [az2a33 — a23032)] — 412 [az1033 — a23031] + 013 (a21 032 — a22431) . 
También hay un método para memorizar esta fórmula, llamado Regla de 
Sarrus, que consiste en agregar las dos primeras columnas a la derecha 
de A, y se suman todos los productos de los elementos que van de la 
izquierda superior a la derecha inferior y se restan todos los productos de 
los elementos que van de la izquierda inferior a la derecha superior. Así: 


q11 012 013 q11 q12 
y A A Y 

A] = [a91 22 23 d21 22 
ye Y Ps he 

031 032 033 q31 032 


= 411422433 + 012493431 + 0413021032 — 431422013 — 432023011 — 033021012. 
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Nota 1.1 La Regla de Sarrus no se puede aplicar para calcular determi- 
nantes de matrices de tamaño 4 x 4, 5x 5 o para matrices de más alto 


orden. 


Hasta ahora, se ha evaluado los determinantes para matrices de ta- 
maño 2x 2 y 3x3. El determinante de una matriz de tamaño n x n se 
obtiene usando un método en el cual se reduce el problema a la evalua- 
ción de determinantes de matrices de orden n — 1; el proceso se repite 
sucesivamente hasta llegar a las matrices de tamaño 2 x 2. Nótese que 
este procedimiento fue empleado para calcular el determinante en la ex- 
presión (1.5), eliminando de A la fila y la columna, que indican el primer 
y segundo subíndice del elemento a;¿ por el que van multiplicados, los 
determinantes de las submatrices de tamaño 2 x 2, los cuales reciben el 
nombre de menores, y cuando se les asocia los signos +,—,+ se denomi- 
nan cofactores o adjuntos. Las definiciones de estos conceptos son: 


Definición 1.15 Menor y cofactor 


Sea A = la¡¡] una matriz real de tamaño n x n. 


1. Se le llama menor complementario (i,j), al determinante de la sub- 
matriz de tamaño (n—1) Xx (n—1), que resulta de suprimir la ¡-ésima 


fila y la j-ésima columna de A y se denota por M;¿(A). 
2. El adjunto o cofactor (i,j) de A viene dado por 


e ed l sid+3.€es par; 
Cij(A) = (0 M,(4) donde Enea = 

-1 si1+3 es impar. 
Definición 1.16 Matriz de cofactores 


La matriz C = [C;¿¿¡(A)], donde el elemento C¿¿(A) es el cofactor (i, j) 


de A, se denomina matriz de cofactores. 
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Teorema 1.7 Fórmula o expansión de Laplace 
Sea A = [a;¡] una matriz de tamaño n x n. Entonces, el determinante 


de A se puede desarrollar usando: 


¿) La expansión de Laplace por la ¡-ésima fila como 


det A= Y ayCy(a) = 0) agMy(A). 


j=1 j=1 


11) La expansión de Laplace por la j-ésima columna como 


det A= Y aj¿Ci¿(A) = Y (-1)*a¡¿Mi¿(4). 


i=1 =1 


Demostración. 
Queda como ejercicio para el lector. M 


Teorema 1.8 Propiedades de los determinantes 


Dadas A, B y C' matrices de tamaño n xn ya. ER, se verifica que 
¿) det A? = det A. 


11) Si se multiplica solo una fila (o columna) de la matriz A por un 


escalar a, entonces el determinante queda multiplicado por Q. 
111) El determinante de la matriz a.A es 


det (0.4) = 0” det A. 


iw) Si todos los elementos de una fila (o columna) de A son cero, el 


valor del determinante es cero. 
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v) Si las matrices A, B y C difieren exclusivamente en los elementos 
de la ¿-ésima columna, siendo los elementos de esta columna para la 
matriz C la suma de los respectivos elementos de la j-ésima columna 


de las matrices A y B, entonces 
det C = det A + det B. 


El mismo resultado se cumple cuando las tres matrices difieren de 


manera análoga en una fila. 


vi) Si dos filas (o columnas) cualesquiera de A se intercambian, el valor 


del determinante se multiplica por —1. 


vin) Si dos filas (o columnas) de A son proporcionales o iguales, el valor 


del determinante es cero. 


viii) Si se suma un múltiplo escalar de una fila (o columna) de A a otra 


fila (o columna) de A, entonces el determinante no cambia. 
iz) a) det(A.B) = det A. det B. 
b) Para cualquier k € N, k H 0 det(4*) = (det Ay. 
c) Si A es invertible, entonces det(A7*) = (det A”. 


Demostración. 
Queda como ejercicio para el lector. M 


Teorema 1.9 Sea A una matriz de tamaño n x n, A es invertible si y 
solo si det A 4 0. 


Demostración. 
Queda como ejercicio para el lector. M 
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Definición 1.17 Matriz adjunta 
Sea A una matriz de tamaño n xn. La matriz transpuesta de la matriz 


de cofactores C¡¿(A) es la adjunta de A y se representa por Adj(4) : 


Ciu(4) Ca(4) ... Cri(A) 
Adi(A) = de al Ñ dd (16) 
CinlA) CoanlA) ... CunlA) 


Teorema 1.10 Sea A una matriz de tamaño nxn, si det A X 0, entonces 


A”! = Adj(A)/ det A. 


Demostración. 
Queda como ejercicio para el lector. M 


1.3.1 Algunas fórmulas útiles para inversas 


e Para una matriz invertible de tamaño 2 x 2, se obtiene 


1 a —a 
o 22 12 
n=, rd ol (17 


e Para una matriz invertible de tamaño 3 x 3, se obtiene 


Cu(A) Car(A) C3r(A) 
Cia(A) Ca2(A) C32(A) (1.8) 
Ci3(4) Caz(A) C3z(A) 


A7“t== 
Al 


1.4 Tipos especiales de matrices cuadradas 


Los tipos de matrices que se analizan a continuación tienen características 
particulares y, como se presentan frecuentemente en el desarrollo de la 
teoría y en las aplicaciones, han recibido denominaciones especiales. 
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Definición 1.18 Matrices triangulares 

Una matriz cuadrada real A = [a;¿] cuyos elementos abajo de la diago- 
nal principal son todos cero, es decir aj¿ =Ú para i > j, se llama matriz 
triangular superior. De manera análoga, una matriz triangular inferior es 
una matriz cuadrada real A cuyos elementos arriba de la diagonal prin- 


cipal son cero, es decir aj¿ = 0 para 1< j. 


Teorema 1.11 Propiedades de las matrices triangulares 
Sean A, B € Mnn matrices triangulares superiores (inferiores) y a € 


R, entonces: 
1) Las matrices A+ B y qA son triangulares superiores (inferiores). 
11) La matriz A.B es también triangular superior (inferior). 


111) El det(A) es igual al producto de los elementos de la diagonal prin- 


cipal. 
iw) La transpuesta de A es triangular inferior (superior). 


v) La matriz A es no singular si y solo si cada uno de los elementos 


de la diagonal es distinto de cero. 


vi) Si A es invertible, entonces A7* es triangular superior (inferior). 
Demostración. 
Queda como ejercicio para el lector. M 
Definición 1.19 Matrices simétricas 
Una matriz cuadrada real A = [a;¡] se llama simétrica si la transposi- 


ción la mantiene invariable, es decir [a;¿] = [ass]. 
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Teorema 1.12 Propiedades de las matrices simétricas 


Sean A y B matrices simétricas de tamaño n xn y 4 ER, entonces: 
¿) A+ B y QA son simétricas. 


1i) Cuando A.B = B.A, entonces A.B es simétrica. Sin embargo, esto 


no es cierto si A y B no conmutan en el producto. 
iii) Si A es invertible entonces su inversa A7* también es simétrica. 
iv) Dada una matriz cualquiera C' de tamaño m x n, 


a) Sim=mnm, la matriz MC + C*) es simétrica. 
b) Sim A nosim = n, las matrices (C.C*) y (C*.C) son 
simétricas. 


Demostración. 
Queda como ejercicio para el lector. M 


Un tipo especial de matrices simétricas son las matrices escalares. 


Definición 1.20 Matriz escalar 
Una matriz real S de tamaño n x n se llama matriz escalar si resulta 


de la multiplicación de I,, por un escalar c € IR, es decir 
SS = CL. 


Teorema 1.13 Propiedades de las matrices escalares 
Si A = al, y B = bl, son matrices de tamaño n x n escalares, 


a, LbER, entonces: 


1) Las matrices A+ B y A.B son también matrices escalares. 
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11) El det(A) = a”. 

ii) La transpuesta de A es una matriz escalar. 

iw) La matriz A es no singular si y solo si a 4 0. 

v) Si A es invertible, entonces AT? es también una matriz escalar. 


vi) Si Ces una matriz de tamaño n x n, entonces C' conmuta con A, 
es decir, CA = AC. 


Demostración. 
Queda como ejercicio para el lector. M 


Cuando todos los elementos s;¡¿ de S no son iguales al escalar c, se tiene 
un nuevo tipo de matrices simétricas: las matrices diagonales. 


Definición 1.21 Matrices diagonales 
Una matriz cuadrada real A = la¡¡] cuyos elementos arriba y abajo de 
la diagonal principal son todos cero, es decir que aj¡ = 0 para toda 1H j, 


se llama matriz diagonal. 


Teorema 1.14 Propiedades de las matrices diagonales 


Si D = [d;¡] es una matriz diagonal de tamaño n x n, entonces: 


1) Su producto por otra matriz diagonal también corresponde a una 


matriz diagonal. 


11) El det D es igual al producto de los elementos de la diagonal prin- 


cipal. 


111) D es una matriz no singular si y solo si todos los elementos de la 


diagonal son distintos de cero. 
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iw) Si sus elementos de la diagonal principal d;1,da2,...,dyy son todos 
distintos de cero, D7| es también una matriz diagonal con elemen- 


tos en la diagonal principal iguales a 1/d11,1/d22,...,1/dnn. 


Demostración. 


1) Sea C = [c;,¿]. Entonces, el elemento ¿j de DC es 


n 
> dk Chjs 
h=1 


pero como D y C son matrices diagonales, entonces d¡¿ =0si1X% k 
y Cp =0sik A Jj. 

Luego, el término d;cxj=0 si 1 4 j. Por lo tanto, el único término 
que posiblemente es distinto de cero en esta suma es cuando 1 = 
j = k, es decir el término d;¿c;¡¿ que corresponde al elemento ¿3 de 


D.C. 


11 


— 


Se procede por inducción. 


Si se desarrolla el det D = |D| por la primera columna, se obtiene 
|D| = d111D*|, donde D' es una submatriz real de tamaño (n—1) x 
(n — 1) obtenida al borrar la primera fila y la primera columna de 
D. Ahora, obsérvese que D' también es diagonal. Se deja al lector 
completar los detalles de la prueba. 


11) Dado que una matriz real de tamaño n x n es no singular si y solo 
si su determinante es diferente de cero, si D es diagonal, de la parte 
¿1) se tiene que |D| = d;¡ : daa - ...: dnn, y este es distinto de cero 
si y solo si cada di; % 0. 


¿w) Esta se sigue inmediatamente a partir de ¿) y de 212). Si cada di; 4 0, 
di. € 3. 0 1/da 0... 0 
0 dea ... 0 A 
Ea ; E O l = 17. 0 


DM 0 a aL] 0 OA e 
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Definición 1.22 Matrices antisimétricas 
Una matriz cuadrada real A = la;;] se llama antisimétrica si la trans- 


posición da como resultado la negativa de A, es decir A! =—A. 


Teorema 1.15 Propiedades de las matrices antisimétricas 


Sean A y B matrices cuadradas antisimétricas y Y € R, entonces: 
1) A+4B yA son antisimétricas. 


1i) Cuando AB = BA, entonces AB es antisimétrica. Sin embargo, 


esto no es cierto si A y B no conmutan en el producto. 


iii) Si A es invertible, entonces su inversa AT! también es antisimétri- 


ca. 


iv) Dada una matriz cualquiera C' de tamaño nx n, entonces la matriz 
¿(0 —- C*) es antisimétrica. 
Demostración. 
Queda como ejercicio para el lector. Mi 
Definición 1.23 Matriz ortogonal 
Sea A= ld; 42 ... dn] una matriz real de tamaño n xn, donde a; es 
un vector n Xx 1 formado con los elementos de la ¿-ésima columna de A. 


Entonces, A es ortogonal si y solo si 


0 si 143. 
Este producto en algunos casos se denota con el símbolo d;;, el cual se lee 


delta ij y se denomina Delta de Kronecker. 
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Teorema 1.16 Propiedades de las matrices ortogonales 


Sean A y B matrices ortogonales de tamaño nx n y 4 ER, entonces: 


í) A es ortogonal si y solo si A? = AT! o idénticamente si y solo si 


AA = In (1.9) 


1i) AB y BA son ortogonales pero, en general, A+ B y 0A no lo son. 
13) El valor absoluto del det A es 1. 
iw) La transpuesta de una matriz ortogonal es ortogonal. 


v) Dada una matriz antisimétrica C' de tamaño n x n, entonces la 
=1 
matriz A = (de — C) En + C) es ortogonal. 
Demostración. 


¿) Por la unicidad de la inversa de una matriz y sus propiedades, se 
tiene que 


AM=1,>4 AAA > A = 47 
A=A > AM =A.4 7? >A.A'= lp. 
11) Si A y B son ortogonales, entonces A.B también lo es, ya que 
(4.B)(4.B) = A.B.B..At=A.I, Al =A.A! = 1, 
Análogamente, se prueba para B.A. 
¿ii) Si A es ortogonal, como A*.A = 1,,, se tiene que 
det (La) = det (4*.A) = det (45) det A = 1 
y como det (4?) = det A, se ve que (det Ay” = 1, y por tanto, 


det A = +1. 
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¿v) Obsérvese que 4*.A = 1,, se puede escribir como At(Aty' o 


v) Si C € Mnn es antisimétrica, se tiene que C? = —C, y por las 
propiedades de la matriz transpuesta, resulta que 


AA e 


| o EAN al MO EOr 
= [(2.+0) 7] (1a 0) (La — 0) (In +0)” 
= (La — 0) (La + 0) (a — 0) (Ln +0)? =1,, 
porque (1, + C) (In — C) = (Ln — O) (Tn +0). 


Así pues, Á es ortogonal en virtud de la ecuación (1.9). mm 


Definición 1.24 Una matriz ortogonal A tal que det A = 1 se llama 
matriz ortogonal propia y si el det A = —1, se denomina matriz ortogonal 


1Mprop1a. 


cosg  sen0 
Ejemplo 1.1 ¿Es ortogonal la matriz A = 


-senó cosó 


Solución. 
Al multiplicar a A por la derecha por 4*, se obtiene 


cos O 0] bs ler E F , 


-senO cos0| [send  cosó o 1 


AM'= | 
Esto muestra, por la ecuación (1.9), que A es ortogonal. 


Definición 1.25 Matriz de reflexión 


Una matriz ortogonal A tal que A? = I,, se llama matriz de reflexión. 


Definición 1.26 Matriz de permutación 
La matriz elemental tipo R3z de tamaño n xn se denomina matriz de 
permutación, ya que resulta de intercambiar (permutar) el orden de las 


filas de la matriz L,. 
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Teorema 1.17 Sea P una matriz de permutación, entonces: 


a) Para cualquier matriz A, se puede obtener PA a partir de A per- 
mutando las filas de A exactamente como se permutaron las filas de 


[,, para obtener P. 


b) P es no singular y ortogonal. 


Demostración. 


a) Esto se sigue fácilmente de las definiciones de la multiplicación de 
matrices y de matrices de permutación. 


b) Separe P en sus respectivas filas 7,,F2,..., 7, que son tan solo las 
filas €,* de [,, en cierto orden. Entonces P* tiene como columnas 
a F;*. La definición de la multiplicación de matrices implica que el 


> 


elemento (i, j) de PP? es simplemente mA, y esto es 


losii=j 
er pe: 
de =0y=( 0 Zo. 


Es decir, PP? = [,. De manera análoga, en términos de las colum- 
nas de P, se demuestra que PP = 1,,. um 


Definición 1.27 Una matriz N de tamaño nxn se dice que es nilpotente 


de índice k, si NF =O para algún k € N, pero N*=1 4 0. 


Teorema 1.18 Si NV es una matriz cuadrada nilpotente, entonces: 


det N =0 y te( NJ =0. 


Demostración. 
Queda como ejercicio para el lector. M 
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1.5 Matrices particionadas 


Una característica importante en el trabajo que se hace con matrices 
reales es el de considerar la matriz A como una lista de vectores columna 
en lugar de simplemente una serie rectangular de números. Este méto- 
do ha sido tan útil que ahora se desea considerar otras particiones de la 
matriz A, tomando por regla la división de A tanto horizontal como ver- 
ticalmente. En esta sección se estudia la forma de particionar una matriz 
en submatrices que nos permitan desarrollar de manera más sencilla las 
mismas operaciones que definimos anteriormente para las matrices. 


1.5.1 Definiciones y operaciones 


Si A = [(a;¿] es la matriz que se obtiene después de que algunas filas 
y/o columnas de A se han eliminado es llamada una submatriz de A. 
Con frecuencia es conveniente particionar una matriz en submatrices y 
considerarla como una matriz cuyos elementos son estas submatrices. 


Definición 1.28 Una matriz A de tamaño mx n puede particionarse de 


la siguiente manera 


Ar: Az ... As 
Ag Az ... As 

A= 21 22 2 (1.10) 
Ar1 Arz ... Ars 


donde A1 es la submatriz real de tamaño mi, x ni formada por los ele- 
mentos de A que ocupan las m, primeras filas y las ni primeras columnas; 
Axa €es la submatriz real de tamaño m, x na formada por los elementos de 
A que ocupan las mi primeras filas y las columnas nj; +1,...,Nn1 +Na, Y 
así sucesivamente. En general, A;¿ es la submatriz real de tamaño m;xn; 


formada por los elementos de A que ocupan las filas 


m+... m1 1)mM37+...+mM-1+2,...,M1+...+M-1+mMi 
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y las columnas 
is cl A ss EA GS 


siendo m; y n¿ números naturales tales que 


r Ss 
me DM Y n= Y),n 


¿=1 q= 
Se denotará el tamaño de la partición de A por bloques de la siguiente 


manera: 
(m +m2+...+m,)x (ni +n2+...+Ng). 


Ejemplo 1.2 Sea la matriz 


411 0412 Gig 014 dal 


a421 0422 0423 024 025 


31 32 033 0Q34 035 
041 042 0a4zg 044 MM 


Obtenga una partición de A de tamaños 


(1)Q+2x(2+2+1) y (00 (1+2+1 x (2+3). 


Solución. 
En el primer caso, 


a11 012 E 413 014 a 
a21 022 : 423 024 ; 025 

A 5 ) 
a31 032 E 433 034 E a 
041 042 : 043 044 : 045 
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la cual puede ser escrita de la forma 


A= 
donde 
a11 012 
Aj = Aja = 
021 022 
431 032 
Ag = Az = 
041 042 
En el segundo caso, 
a11 012 
O 
A= | a 
431 032 
041 042 


la cual puede ser escrita de la forma 


11 
A= / 
21 
/ 
31 
donde 
/ 
11 >= [071 a12), 
r _ [091 092 
2L, 
a31 032 
/ 
31 = [a41 042), 


013 014 
493 024 
0433 034 
043 044 
013 Ql4 015 
023 024 0425 
0433 Uza 035 
043 044 045 
/ 
12 


/ 
12 = [a13 
/ 023 
2 

0433 
/ 
39 = [a43 


014 


024 
034 


044 


a15] > 


025 
035 


o 


0.45) 4 
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Definición 1.29 Submatriz principal 

Si A es una matriz cuadrada de tamaño n Xx n, se le llama submatriz 
principal a toda submatriz de A formada eligiendo los mismos índices para 
las filas y las columnas. Si k es un subconjunto propio de [1,2,...,n), 
denotamos por A(y, la submatriz principal de A resultante de seleccionar 
las respectivas filas y columnas indicadas por k. 


El hecho de tomar las mismas filas y columnas es equivalente a que los ele- 
mentos de la diagonal principal de la submatriz han de ser elementos que 
ya formaban parte de la diagonal principal de la matriz original. Luego 
si A es simétrica, cualquier submatriz principal también es simétrica. 


Nota 1.2 El número total de submatrices principales de orden r que se 


n 
pueden obtener de una matriz A de orden n es igual a ( ) 
r 


Ejemplo 1.3 Obtenga algunas submatrices principales de la matriz 


a 2.1 


|-4 8 10 0 1 


A=| 3 12 11 2 1 


Solución. 
Las siguientes matrices son submatrices principales de orden 2 de A: 


e o 8 
Aa= 7; al Aa = le 


el número total de submatrices de orden 2 que se pueden obtener de A 


a) = 10. Algunas submatrices principales de orden 3 de A son 


es (Es 


ON 
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el número total de submatrices de orden 3 que se pueden obtener de A 


es () = 10. Nótese que la submatriz 
51 0 
B=|-4 0 -—1 
2 2 1 


no es principal, porque se ha obtenido con las filas 1, 2 y 3 y con las 
columnas 1, 4 y 5. 


Definición 1.30 Submatriz angular 
La submatriz principal que es formada con las primeras k filas y k 


columnas de la matriz A y que denotaremos por Ay, siendo k el orden 


de la submatriz, se denomina submatriz angular. 


Si A es la matriz cuadrada de tamaño n x n: 


d11 012 Es 

021 022 02n 
A= ls 

nl 0Un2 +... da] 


entonces las submatrices angulares de A vienen dadas por 


a11 d12 013 
o B]= 


Ay = [011], Atg = ba e d21 3 0g3|,-..., An = 4. 


421 022 
a31 032 033 


Así, en el Ejemplo 1.3, la submatriz A((1 9), sería una submatriz angular, 
concretamente Ata 


Definición 1.31 Dos matrices A y B están particionadas idénticamente 
si las submatrices resultantes contienen el mismo número de filas y de co- 
lumnas y si, además, las partes correspondientes tienen el mismo tamaño. 
Por tanto, dos matrices particionadas idénticamente son iguales si y solo 


si las submatrices correspondientes son iguales. 
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Definición 1.32 Suma de matrices particionadas 
Sean A y B dos matrices particionadas idénticamente. Entonces la 
suma de A y B tendrá igual partición. En este caso, cada bloque de A+ B 


es obtenido de los correspondientes bloques de A y de B, es decir, 


Aui+Bu Ar+B1 ... Ars+ Bis 

Axn+B2 Am+Boa ... As + Ba 
A+B= (45) + [By] = A E 

AnmtBra AnmtBra ... Ars +Brs 


donde las submatrices Aj; y B;¿ son de tamaño mi X nj. 


Definición 1.33 Multiplicación por un escalar 
Si A es una matriz real de tamaño m x n particionada y a €R, en- 
tonces la multiplicación de un escalar por A es una matriz real de tamaño 


mxmn obtenida de multiplicar cada bloque de A por el número a. En otras 


palabras, 
Ar1 Ao os A1s QA QA: Puse QA 
Ao1 Ao O Aos aA9] a.A e aA9s 
QA =Q0 = ; 
LA Ara 0. Ars! Lada QÁr2 ... ada! 
donde A; son submatrices de tamaño mix nj para i=1,2,...,r, j = 


1,2,...,8, donde Mi FMa3+... FM? =MYN¡+N9+...+N¿=N. 


Definición 1.34 Transpuesta 
Sea A una matriz real de tamaño m x n particionada de alguna ma- 


nera. Entonces la transpuesta de A que se escribe A? es una matriz real 
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de tamaño n x m obtenida de intercambiar los renglones por las columnas 


en cada uno de los bloques A;;. En otras palabras, 


O Aso AL Ab AL, 
Ao A ... A A At sua 
si A= il , entonces A! = See OR E , 
Ari Ara ... e Pc OA ae 
donde A; son submatrices de tamaño m; xn; para i=1,2,...,r, j = 


1,2,...,s, donde Mi FMa2+...+FMp=MYyNi +n2+...+N5=N. 


Ejemplo 1.4 Obtenga la transpuesta de A para una partición de tamaño 


Q+1)x(Q+2): 


A= 
21 3 13 5 
Solución. 
Consideremos la partición (2 +1) x (2 +2) de A, es decir, 
8 9 : 3 -s| 
An: Asa l 
a A 5 10 : -10 * 
de dde có 2 
[21 5 18 5 ] 
Luego, 


a —[8 9]'_[8 20 a [3 -—5]"_[3 -10 
314” (20 101 [9 10|” A PE CO O Y ll 
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por consiguiente, 


E E 
9 10 5 
0 10: + <= 5 | - 
a 10 + 15 
e E 
5 8 5 


Teorema 1.19 Multiplicación 


Sean A y B matrices particionadas compatibles para el producto, di- 


gamos entonces 


A11 A Saja Ars Bi Bi Le Bi 
Ax Az ... Azs Ba B2 ... Ba 
Arz Ar2 ... Ars Bs1 Bs2 ... Bst 


Por tanto, la multiplicación de las dos matrices es 


Ci C12 603 Ci 

Ca1 Ca dro Cor 
AB= | ] 

Cr1 Cr2 ... e 


donde Ci =- Y, Ay Bit 
j=1 


Demostración. 

Consideremos (mi +ma3+...+my)x (ni +n2+...+n5) una partición 
de A y (ni +n2+...+5) x (p +p2+... + pe) una partición de B. 
Entonces, 


Aj = [07] mimat m1 +1<h<mi+m2+..+m¡-1+mi 
ni+n24..+95-1+1<1<0n1+02+..+05-1+N5 
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Bj = [bg] ntna+o enjo141<l<m+n34..+95-1+405 
P1+P2+ 0 +FPr-1+1<SP1+P2+- > +Pr-1+Pk 
Ni+. PFNj-1+FNg 
AsjBir = Y Ap1D1g 
l=n1+...+nj-1+1 mi+..+m¡-1+1<h<m+...+m;-1+m4 
P1+P2+.+Pr-1+1<9<P1+P2+.-FPkR-1TFPk 
y por tanto 


Ss 
Ca = Dd AygBi 
j=1 


pa P on 


mi++mat..+m¡-1+1<h<m1+m2+...+mM¿-1+Mi 
P1+P2++ +FP-1+1<SP1+P2+- FP 1 T+Pk 


es decir, C;¡z es el bloque (i, k) correspondiente a la partición 
(ma + ma +... + Mp) x (p1+Do+-.-.+ Dr) 


de la matriz 4.B. Mm 


15 


Ejemplo 1.5 Calcular A.B asumiendo una partición para A de tamaño 


(2+1) x Q+2) y otra para B de tamaño (2 +2) x (2 +2), donde 


Solución. 
La partición de tamaño (2 +1) x (2 + 2) para A es 


8 93 3 -=5 
Ar ] Az 
As 20 10 : -10 8 
a E cs E són 
135518 5 
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y la partición de tamaño (2 +2) x (2 +2) para B es 


za 3 1 
Bu : Bi L LL sl <-l 

A A O A E (1.11) 
Ba : Ba Lai 1 1 
=i 2 =l 


Luego, 


18 18 32 48 


e me] a = 2 _ le Él 
37 16] +[8 —8] =[45 8], 
68 26|+|[23 8] =[91 34]. 


25 17 8 —8 33 9 
AB + A12Ba = | | + _ | = | | , 
A11B12+ A12B92 = | 


AB + AB = 
A>1B12 + A29B22 = 


Por consiguiente, 


AB=|32 48 : 56 -8 


1.5.2 Determinantes de matrices particionadas 


En esta sección se muestran algunos resultados para encontrar el deter- 
minante de una matriz cuadrada particionada en bloques. 


Teorema 1.20 Sea A una matriz real de tamaño n x n particionada 


como sigue: 


A= N (1.12) 
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donde A; son submatrices de tamaño n; x n; para i, j=1,2, con ni + 


na =Nn,0<n¡,<n. S Aj =0 o si Az; = O, entonces 


det(4) = det(A11) det(A22). 


Demostración. 

El resultado se prueba por inducción sobre k. Sin pérdida de gene- 
ralidad, supongamos que A19 = O y asumamos que el teorema es válido 
para todas las matrices de tamaño (n— 1) x (n— 1) de la forma apropia- 
da. Como el determinante de una matriz A de tamaño n x n, se puede 
calcular mediante la expansión de Laplace (método de cofactores) por la 
primera fila, como sigue 


det A = Y (-1)'*1a1,M3,(4) (1.13) 
j=1 
= 11M (A) — a12Mp(A) +... + (=D an Min(A), 


donde cada uno de los menores complementarios My; (4) son de la forma 


EAS 


PES [Aoi], Aso 


E j=1,2,...,k. 


Aquí, [al] se consigue borrando de A11 la primera fila y la j-ésima co- 
lumna y [491] ¡ Se obtiene de suprimir de A91 la j-ésima columna. Por 
inducción sobre k, 


Mi (4) = dee( [421]) det (A32). 


Si se reemplaza en (1.13), se tiene que 


k 
det A = NE) ar det [47]|) det (499) 
¿=il 
= det (411) det(429), 


como se deseaba. MM 
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Definición 1.35 Complemento de Schur 
Sea A una matriz de tamaño n x n particionada como en (1.12), si 
A¡1 es una submatriz principal no singular de A, se define el complemento 


de Schur de A¡¡ en A, denotado (4/411) como sigue: 
(4/411) = 422 — A214,1 412. (1.14) 


Teorema 1.21 Fórmula de Schur 
Sea A una matriz real de tamaño n x n particionada como en (1.12). 


Si A11 y A22 son submatrices cuadradas, entonces: 
1. Si Ay1 es no singular se verifica que 
det A = det(A11) det [(4/411)), (1.15) 
donde la submatriz (4/411) = Ao» — A21 43 Ajo. 
2. Si Aga es no singular se cumple que 
det A = det(A29) det |(4/493)), (1.16) 


donde la submatriz (4/42) = Aj1 — A12427 Az. 


Demostración. 


1. Consideremos que en la partición (1.12) la submatriz A11 es no 
singular, luego la matriz A se puede factorizar como sigue 


ve ha _ ba O | R sl 
Az Az Ax (4/A11)] [O I 
_<——_ 
A = L U 


Fácilmente, el lector puede probar que A = LU. Por otra parte, 
como det(LU) = det(L) det(U) para matrices cuadradas L y U, 
por el Teorema 1.20 se tiene que 


det A = det (LU) = det(A31) det[(4/A11)] . 
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2. Queda como ejercicio para el lector. M 


Ejemplo 1.6 Obtenga el determinante de la matriz B dada en el Ejem- 


plo 1.5, asumiendo una partición de tamaño (2 +2) x (2 +2). 


Solución. 
Usando la partición dada en (1.11) de la matriz B, se tiene que B11 
es no singular ya que su determinante es 1. Luego 


=1 
1 -—1//2 1 3 1 9.5 
=1 _ ES 
BaBy Bu = le , a a ha el M E Ñ 
Nótese que esta matriz no es invertible, por otra parte, 


— 1 | TT 51 (8 <= 
(B/B11) = Bo — BaB;] Bra = o aj zo al" l1 al> 
tiene determinante igual a 12. Usando la expresión (1.15) se tiene que 


det B =1-+12=12. 


1.5.3 Inversas de matrices particionadas 


Para determinar la inversa de una matriz cuadrada, usualmente se emplea 
el método de Gauss-Jordan o el método del determinante y la matriz 
adjunta. En esta sección se ilustra la manera en que se pueden calcular 
las inversas de las matrices usando particiones. 


Teorema 1.22 Sea A una matriz real no singular particionada como 


en (1.12), con Aj1 y Az2 submatrices cuadradas no singulares. Entonces: 


1. Si A12 =0, la inversa de A es 
-1 
An 0 A O 


Az Az Az And] Az 
2. Si A21 =0, la inversa de la matriz dada en (1.12) es 


-1 
Ar Ar añ —A Arg Ao 


O A» O As 
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Demostración. 
Si A7! es la inversa de A, entonces se debe cumplir que 447! =1. 


1. Supóngase que A es una submatriz nula, entonces 


e A 0) A O 
A EA 


Ag Az] |—A33 Ar Aj, Az3 
| An Aj! O | Ñ E al 
AnAj, — AA A Ajo A29 Ax) Or ¿di 
2. De manera análoga, cuando A91 = O, se tiene que 
AA? => Az Axa An —A ¡AA 
O A 10) A 
_ [41437 414 — A1143 41243] _ [ln O 
O A29 Az O- Tal” 


Nótese que en ambos casos se obtiene la matriz identidad. MM 


Teorema 1.23 Inversa de una matriz particionada 


Sea A una matriz no singular particionada como sigue: 


Ne Ar1 Az 


Aza Az2 
donde A; son submatrices de tamaño n; x n; para i, j=1,2, con ni + 


n2=n y0<n¡<n, denotando A7! por G y particionando G_ como 


ia (4/42) * Gi2 


-1 
Ga (4/411) 
donde G;¡¡ son submatrices de tamaño n¿ Xx nj para i, j = 1,2. S1 


det (411) 40 y det (492) AF 0, se tienen los siguientes resultados: 


1: (4/A22) = Ar] — A12 4,7 Agr existe y es no singular. 
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2. (4/A11) = Asa — A21 43 Aro existe y es no singular. 


3. AT! puede escribirse como 


) AT! (A/A22) * -(4/A22) A 42 
107 = 
(A/A) AnAzt  (4/4u)7 
te (A/A29) AAA JA” 
— Az Agr (A/ Ago) * (A/A11)* 
Demostración. 


Para probar que (4/42) es no singular, se multiplica A por la iz- 
quierda por la matriz no singular Af 


Tn —A1r Az 
= [0 Aj Jj 


Fácilmente, el lector puede probar que AfA = C, donde 


o [(Ata) al 
Aso As Lmg |? 


pero por el Teorema 1.20 se tiene que 
det(C) = det|(4/422)] det(1,,) = det(414) = det(4j) det(4) 4 0. 
En consecuencia, 
(4/422) = An A12 437 Ag1 


es una matriz no singular. 
Para probar que (4/A11) es no singular, se multiplica la matriz A 
por la izquierda por la matriz no singular: 


An: O | 
A*— no 
; Las Im 
Por otra parte, del resultado GA = /,, se tiene que 


(A/A22) * G12 he ña] a le sa 
Ax Az O In 


G21 (A/A) ” 
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y de estas se obtienen las siguientes cuatro ecuaciones matriciales 


(4/422) "An +Gi491 = In, (1.17a) 
(4/422) *A12 +Gi2499 = O, (1.17b) 
Gar Ar1 + (4/A11) 421 =.0, (1.17c) 
Go Ay + (A/A11) Ao = In. (1.17d) 


Si se multiplica por la derecha de la ecuación (1.17b) por Ads se tiene 
G12 =—(4/A22) "Ar 432. 
Si se reemplaza en la ecuación (1.17a) y se factoriza, se obtiene 
(4/42) * [411 — 41243 491] = In, (1.18) 


Así, (4/422) existe y es igual a 411 — A12 427 Az. 
De manera análoga, si se utilizan las ecuaciones (1.17c) y (1.17d), se 
puede probar que 


(4/411) 7 [409 — 421431412) = Ino, (1.19) 


es decir, (4/A11) existe y es igual a 499 — A Aj Aro. 
De reemplazar en G12 y Ga1, se sigue la prueba de 3.a). Mm 


Corolario 1.23.1 Sean A y G como en el Teorema 1.23, entonces se 


satisfacen las siguientes condiciones: 


1. (4/A22) * = Az + A Ap9(4/A1) *A21Az1, 


Zi (A/A) == AS + Az7 A91 (4/42) Ar Ajz, 


1 


3. Az An(A/A22) * =(4/A) “AmaAz, 


1 -1 
A12 43 > 


7 
4. Aj Ay (A/An) * = (4/422)” 


donde (4/422) = Ar == A12 427 A91 Y (4/A11) = Aa = A21 4, Azo. 
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Demostración. 
Como Aj: es invertible, la matriz A se puede factorizar como sigue 


he pel a pe O ls e 


Az21 Az Ag (4/41) | O Ino 
O —— A 
A = L U 
Luego 47! =G =U71L7!, y por el Teorema 1.22, se obtiene 


An O 


A“! 1 _ 
(4/41) *AnAj! (4/41) 


Ir — Ar Av 
O In 


A! +A 419(4/411) "A 4] —A Ar(A/An) 
—(4/411) 421 Aj (4/41) 7 


Como en el Teorema 1.23 se obtuvo 47*, comparando los términos se 
obtienen las condiciones 1. y 3. 

(4/42) = A] +4 A12(4/411) "421471, 

Az) A91 (4/42) * = (4/41) "421471. 


Por otra parte, como 4» es no singular, la matriz A puede factorizarse 
de la siguiente manera 


a he _ (4/4) | ES el 


As Az 0 Az2| [422491 In, 
Ús A 
A = R S 


Por lo tanto, A7! = G = S7+R7!, y en virtud del Teorema 1.22, se tiene 
que 


0 Lan dal 


ln (4/22) * (4/42) "Arz Az 
Ay An In 


O Az 


(A/A22) —(4/422) Arz Az 
—Azz Ar1(4/A22) — Az3 + Az2 Ar1(A/A22) Ar2499 


Aquí se comparan de nuevo los términos con los de la matriz 47*, para 
obtener las condiciones 2. y 4. 


(4/41) * = Az + 42 A91(4/A22) *Ar2432, 
AT A12(4/A11) * = (4/422) "412472 


y el corolario queda probado. Mi 
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Ejemplo 1.7 
Obtenga la inversa de la matriz B dada en el Ejemplo 1.5, asumiendo 


una partición de tamaño (2 +2) x (2+2). 


Solución. 
En el Ejemplo 1.6, se obtuvo que det B = 12, es decir B es invertible. 
Asumiendo la partición dada en (1.11) de la matriz B, se tiene que 


E A small EJ AL A 
4" -= mu Alesl 3 SN ly 1 =114 
=i 
E > Md 1 il 
BB Ba = |, E] E A E dl e 


Aunque Bi2Bo7 Ba1 no es invertible, el primer bloque (B mi Bas) ' de la 
matriz B7* viene dado por 


il 
Ni E — 1 2 110 2 
(B/Ba2) e [Bi => B12Bo) Bar] e | 4 | | . 
La submatriz Ga] = —Bao Bar (B/Bas) * está dada por 
ema E AL o al, Lo 0 
ea (2 tl lar als al la 3 
el 
ap [1 9 0"[s 1] _[o9 5 
BB; Bu=|?, a lia E E A E 


A pesar de que Ba1B;¡ Biz no es invertible, el bloque (B/Bu)” se 
obtiene como sigue 


sl 
aj Ñ e -8 -—Á 114 4 
(B/B11) = [Ba = Ba B| Bio] — E 4 | > 12 ln hal j 


y finalmente, se tiene que G12 = —B Bio (B/Bu)”, es decir, 


q. --1P2 0 [3 1][4 4]_1[6 0 
LS lA 1 =1| |=11 31" BE |=138 |" 


Por tanto, 
2 1 3 1]” 0.6 6 0 
ii TL el 1 _ 16 -3 -13 -4 
L Ll TL 1 19 [0-0 4 4 
Al 1% 1 6-9 1 — 
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Ejercicios 1.1 


1. Utilizando particiones, encuentre el determinante y la inversa de la 


matriz dada en el Ejemplo (1.3). 
2. Si A y C son no singulares, pruebe que 


¡) det(1 + AB) = det(I + BA). 


ii) det(A + CBC?) = det(A) det(1 + BO?A71C). 
3. Demuestre que 


P.oeQllr o|ix y P 
xy] 
R Silo o||z w R 


4. Muestre que la inversa de una matriz no singular particionada es 


so 
B ARL O =A TB i 
e A E ca 1, 
D O O I 


donde A es no singular y E=D-—CA“!B. 


1.6 Espacio vectorial 


Los conjuntos R? (vectores en el plano) y R* (vectores en el espacio) junto 
con las operaciones de suma de vectores y multiplicación por un escalar 
se llaman espacios vectoriales. Las propiedades algebraicas de un espacio 
vectorial arbitrario son muy semejantes a las de los elementos de R? y RY. 
En consecuencia, se acostumbra llamar vectores también a los elementos 
de un espacio vectorial arbitrario. 
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Definición 1.36 Un espacio vectorial real? 'V es un conjunto no vacío 


de vectores, dotado de dos operaciones: 


Suma Multiplicación por un escalar 
VxvV>V RxV>=vV 
(2,7) => + (0,7) > af 


que satisfacen los diez axiomas enumerados a continuación. 


1.6.1 Axiomas de un espacio vectorial 

Dado V un espacio vectorial real, se verifica que 
e Para la suma en V: 

(i 

(ia 


(ii 


) Clausurativa: si Y, y € V entonces 7 + y € V. 

) Asociativa: para todo 2, y y ZE V, (7+ y) +2=2+ (G+ 2h 

) Conmutativa: si 7, y € V, entonces E +y=Y+Z. 

(iv) Existencia de elemento neutro: existe un vector de V denotado 
por 0 tal que para todo EV, +0=0+=2. 

(v) Elemento opuesto: si Y € V, existe un vector — en V tal que 

Z+(-2) =0. 


e Para el producto por un escalar de RR: 


(vi) Clausurativa: si Y € V y a es un escalar, entonces ax € V. 


(vii) Distributiva respecto a la suma de vectores: si Y, € V y a es 
un escalar, entonces a(í + y) = 0 +0. 


(viii) Distributiva respecto a la suma de escalares: si Y € V y a y P 
son escalares, entonces (a + ple = q + BL. 
(ix) Asociativa respecto a la multiplicación de escalares: si Y € V 
y a y fB son escalares, entonces a(8í) = (05) L- 
(x) Existencia del elemento unidad: para cada vector Y € V, 


17 =12. 


2 La palabra “real” significa que los escalares que se usan son números reales. 


1.6. Espacio vectorial 45 


Definición 1.37 Sea V un espacio vectorial y W un subconjunto no vacío 
de V. Se dice que W es un subespacio vectorial de V si W dotado de las 


mismas operaciones definidas en V es, a su vez, espacio vectorial. 


Teorema 1.24 Un subconjunto no vacío W de un espacio vectorial V es 


un subespacio vectorial de V si cumple que: 


1) La suma de elementos de W es un elemento de W. 


11) El producto de un escalar por un elemento de W pertenece a W. 


Una condición equivalente para que W sea subespacio vectorial es que para 
todo par de elementos U y W de W, y cualesquiera a y B de lR, se verifique 


que QU + BW pertenece a W. 


Demostración. 
Queda como ejercicio para el lector. M 


Definición 1.38 Si U y W son subespacios de un espacio vectorial real 


V, entonces se define la suma U + W como 


Teorema 1.25 Si U y W son subespacios de un espacio vectorial real V, 


entonces la suma U + W es un subespacio de V. 


Demostración. 
Se debe probar que U + W satisface las condiciones del Teorema 1.24: 


i) Si 41, u2 € U y %,, wa € W, entonces 


(1 +01) + (Us + 02) = U + U9 +01 + Y € U+W. 
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li) Si a. € R, entonces 


o(úr +1) = qui + a € U + W. 


Finalmente, 0+0 € U+W. Esto prueba que U + W es un subespacio. Ml 


Definición 1.39 Se dice que V es una suma directa de U y W, si todo 


vEV tiene una representación única de la forma 
U=U+40, 
con úu € U yu € V. Esta suma directa se denotará como V= UG W. 


Teorema 1.26 Si U y W son subespacios no nulos de un espacio vecto- 
rial real V, su suma U+W es una suma directa si y solo si U(]W = (0). 


Demostración. 
Queda como ejercicio para el lector. M 


Definición 1.40 Combinación lineal 
Sean U],U2,..., Uy vectores en un espacio vectorial real V. Un vector 


ven V es una combinación lineal de U],U2,...,Un Si 
U=C1UÚ1 + 09092 +... + CnUn 
para ciertos números reales C],C2,..., Cn. 


Definición 1.41 Sea S =(0,,U3,...,0,) un conjunto de vectores en un 


espacio vectorial V, entonces se dice que S es: 


1. Linealmente dependiente o ligado si y solo si existen escalares c¿ € R 


no todos nulos, tales que 


C1U1 + C2U9 +... + CnUn =0. 
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2. Linealmente independiente o libre si y solo si no es ligado. Esto es 


c1U1 + Cc2U9 +... + Cr Un = 0. 


Se cumple solo para (1 =C9=...=Cp =0. 


Definición 1.42 Espacio generado 

SiS = 401,02, ...,Un) es un conjunto de vectores en un espacio vec- 
torial V, entonces el conjunto de todos los vectores en V que son combi- 
naciones lineales de los vectores en S se denomina espacio generado y se 


denota por gen S 


gen (0, U2, Lal ¿Und = (a101 +aQa9U+...+ An Un (0; € RI a (1.20) 


1.6.2 Bases 


En esta sección se continúa con el estudio de la estructura de un espa- 
cio vectorial V determinando un conjunto mínimo de vectores de V que 
describa completamente a V. 


Definición 1.43 Base 

Si V es cualquier espacio vectorial y BD = [U],..., Un) es un conjunto 
finito de vectores en V, entonces BD se denomina base para V si es un 
conjunto generador para V con el número más pequeño de elementos en 
un conjunto generador para V. 


El teorema principal acerca de las bases es: 


Teorema 1.27 Base 
Sea B = [f1,...,Unj un conjunto de vectores en un espacio vecto- 
rial V. El conjunto *B es una base para V si y solo si B es linealmente 


independiente y genera a V. 
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Demostración. 

Queda como ejercicio para el lector. M 
Definición 1.44 Dimensión 

Si un espacio vectorial V tiene una base B con n elementos (n € N), 
entonces se define a mn como la dimensión del espacio vectorial V y se 


escribe 
n = dim V. 
Si V = (0), entonces se tiene que dim V = 0. 


Teorema 1.28 Sea S = [0,,U2,...,U,) un conjunto de vectores en un 


espacio vectorial V de dimensión n. Sea 
A=l0 Va « Uni; 


entonces S es un conjunto de vectores linealmente independiente si y solo 
sidetA %0. 


Demostración. 

Queda como ejercicio para el lector. M 
Teorema 1.29 Suponga que dim V = MN. Si 01,U2,...,Um es un conjunto 
de m vectores linealmente independientes en V, entonces m < n. 
Demostración. 

Queda como ejercicio para el lector. M 
Teorema 1.30 Cualesquiera n vectores linealmente independientes en 


un espacio vectorial V de dimensión n constituyen una base para V. 


Demostración. 
Queda como ejercicio para el lector. M 
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Definición 1.45 Sea B = [01,U2,...,U,) una base para el espacio vec- 
torial V de dimensión n. Las coordenadas de cualquier vector y € V en 
'B se relacionan por 

(7) y = My 1 

Ely = Ma E (12d) 


donde Max NN [01 Ua ... Un] . 


Ejemplo 1.8 Muestre que los vectores U,* = (2,—1) y Us = (1,5) for- 
man una base de R?, y luego halle las componentes del vector 3 *= (7, 4) 


con relación a esta base. 


Solución. 
Fórmese A = [ú, 2] y calcúlese su determinante 
A 
det A = ñ 02] 5 : =11% 0. 


Luego, S = ([0,,U2) es un conjunto de vectores linealmente independien- 
tes y como R? tiene dimensión dos, se deduce que forman una base. 
Para hallar las componentes de y en términos de esta base, se hace 


(y =M == 40 


212 09719 _1[5-1[7] _ 1 f31 
o (-1 5 4  11|1 2||4| 11 ]|15|' 
Estas son las componentes de 7 relativas a la base 0, U2. 


Teorema 1.31 Cambio de Base 
Sean B, = [01,,02,..., Un) y BD, = [W1,Wa,... Un) bases para el 
espacio vectorial V de dimensión n. Dado cualquier vector Y E V, sus 
coordenadas en B,, (2) 3, Y SUS coordenadas en B,, (2) 93, Se relacionan 
por 
(2, = Mg.Ma, (E) yy, (1.22) 


Demostración. 
Queda como ejercicio para el lector. M 
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1.6.3 Espacios con producto interno 


En esta sección se define una operación que no puede ser clasificada como 
externa o interna, pues aunque se opera con los elementos de un espacio 
vectorial, el resultado es un escalar el cual no pertenece al conjunto sobre 
el que se define la operación. 


Definición 1.46 Espacio con producto interno 
Un espacio vectorial real V de dimensión finita se dice que es un es- 
pacio con producto interno si a cada par de vectores u, Uv € V le asigna 


A 


un número real denotado por (U, 1), tal que 


n 
ma=ds=0 =>) 10 (1.23) 
2=1 


Debido a la notación en (1.23), el producto interno se llama con frecuen- 


cia producto escalar o producto punto entre vectores. 


Teorema 1.32 Propiedades del producto interno 
Sea V un espacio vectorial real con un producto interno (, ). Entonces 


para todo u, vu, wW E V y todo a € R, se tiene 
i) (3,0) = (5,0). 

163) (u, (v+w)) = (1,0) + (u, 0). 

iv) ((au), vu) = alu, o) = (u, (av)). 


v) (3,8) >0 y (3,4) =0 si y solo si ú =0. 


Demostración. 
Queda como ejercicio para el lector. M 
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Definición 1.47 Longitud o norma 
Sea V un espacio vectorial real, con un producto interno (,»). Una 
norma en V es una función de V en R, tal que a cada U € V, le asigna 


un número real no negativo, denotado por ||ú|| y definido como: 
[al = y (5, 0). (1.24) 


Teorema 1.33 Propiedades de la norma 


Para todo u,v € V y todo a. € R, 


(2) [Jul] > 0. (55) [dl] =0si y solo si ú =0. 
(12) [[oví]] =|0 ful. (io) [u, 1] < [Ia11171. 
(v) [ú ++] < [Jal] + [1]. 
Demostración. 

Queda como ejercicio para el lector. M 
Teorema 1.34 Sea (,) un producto interno en un espacio vectorial V 
de dimensión finita. Sean U y U dos vectores diferentes de cero. Si 0 es el 


ángulo entre ellos, entonces: 


cos Ó = cos «(uu = EN (1.25) 
alo 


Demostración. 
Queda como ejercicio para el lector. M 


Definición 1.48 Vectores ortogonales 


1. Sea V un espacio vectorial con un producto interno y sean dos vec- 


tores U,U € V. Se dice que U y U son ortogonales (a E 0) si y solo 
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Si: 


2. Un conjunto de vectores S = [8,,U3,...,Umy de un espacio vectorial 
V se dice que es ortogonal si y solo si los vectores son ortogonales 


dos a dos, es decir: 
AO siempre que Aj. 


3. El conjunto de vectores S (en 2) se dice que es ortonormal si y solo 


St: 
a) S es ortogonal. b) [l3,|| =1, para todo i. 


Teorema 1.35 Todo conjunto ortogonal de un espacio vectorial V es li- 


nealmente independiente. 


Demostración. 
Queda como ejercicio para el lector. M 
Teorema 1.36 Proceso de ortonormalización de Gram-Schmidt 
Todo subespacio IH de dimensión k de R” tiene al menos una base 
ortogonal y una base ortonormal. Si B = (0,,U2,...,U) es cualquier 


base de HH, entonces: 


Wi =U1 
> > (0,1), 
wa Va 19 YY1 
[161 | 
de =0 (03, 01) (0, 02) 
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así sucesivamente: 


k-1,>5 > 
e (Us UE) 
Wk —= Uk — Aaa Wi 
TA 
orman una base B" = [W1,W3,..., Wiy ortogonal y 
base B' DB], Ú l 
gen[0],..., Up) = genfwj,..., Up), is 


La base ortonormal B" se obtiene normalizando B': 


p"=( (15 Wk ' 
111"? [10% 
Demostración. 


Queda como ejercicio para el lector. M 


1.6.4 Complemento ortogonal 


Consideremos un subespacio V C R”. Para V puede haber muchos sub- 
espacios de R” que son ortogonales a V (por ejemplo, en R* si V es el 
eje Z, todas las rectas en el plano XY que pasan por el origen y el pro- 
pio plano XY son ortogonales a V). Entre todos los subespacios que son 
ortogonales a V hay uno de particular importancia: aquel subespacio V* 


tal que IR” = Y 9 V*, 


Definición 1.49 Complemento ortogonal 


Sea W un subespacio del espacio con producto interno V. Entonces el 


complemento ortogonal de W, denotado por W”, está dado por: 


W*=(8 EV: (3,0) =0, para todo y € W). 


1.6.5 Subespacios asociados a una matriz 


Hay cuatro subespacios asociados a una matriz, los cuales se consideran 


a continuación. 
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Definición 1.50 Espacio nulo y nulidad de una matriz 


Sea A una matriz de tamaño m x n. Entonces el conjunto 
ker(A) = (ú € R”|4ú = 0) (1.26) 


se llama el espacio nulo de A y v(A) = dim [ker(A)| se denomina nulidad 
de A. 


El espacio nulo de una matriz también se conoce como núcleo. 


Definición 1.51 Imagen de una matriz 
Sea A una matriz de tamaño m x n. Entonces la imagen de A, deno- 


tada por Ima, está dada por: 
Ima = [ú e R"|4u = 1 para algún u € R”). (127) 


Definición 1.52 Espacio de los renglones (o de las filas) de una 
matriz 
Sea A una matriz de tamaño mxn, sean [F,,F2,...,Fmy los renglones 


(o filas) de A. Entonces se define: 
R(A) = espacio de los renglones de A = genfF1,F2,..., Fm. (1.28) 


Definición 1.53 Espacio de las columnas de una matriz 
Sea A una matriz de tamaño mx mn, sean [€,,C2,...,Cny las columnas 


de A. Entonces se define: 


Col(A) = espacio de las columnas de A = genfc],Ca,...,Cnj. (1.29) 
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Definición 1.54 Rango de una matriz 


Sea A = [a;¡] una matriz real de tamaño m x n. Se llama rango de A, 


denotado por p(A), al número máximo de vectores fila (o columna) line- 


almente independientes o también a la dimensión del subespacio generado 


por los vectores fila (o columna) de A. 


Teorema 1.37 Propiedades del rango 


Sea A una matriz real de tamaño mx n, entonces se cumple que: 


(1) 


0< p(4) < mín(m, ny. 
Si p(A) =m<mn, se dice que A tiene rango completo fila. 
Si p(A) =n <m, se dice que A tiene rango completo columna. 


Si p(A) = r < mínfm,nj, entonces existen matrices K y L de 


rango r y tamaños mxr y rxn, respectivamente, tales que A = KL. 
p(L,) =n, con I,, la matriz identidad de tamaño n x n. 

p(O) = 0, con O la matriz nula de tamaño n X n. 

p(A) = p(A”). 

p(A.B) < minfo(A), PB). 


Si A es diagonal, entonces p(A) es el número de elementos no nulos 


en su diagonal. 


Si A es no singular, entonces p(A.B) = p(B) y p(B.A) = p(B). 


Demostración. 


Queda como ejercicio para el lector. M 
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1.7 Sistemas de ecuaciones lineales 


En esta sección se mencionan las relaciones lineales, pues gran parte del 
álgebra lineal estudia y desarrolla relaciones lineales, las cuales son una 
generalización de la ecuación de una recta. 

Definición 1.55 Un sistema de ecuaciones se dice que es lineal si todas 


las ecuaciones que lo componen son lineales en los escalares desconocidos 


o incógnitas 11,19,..., Un. Es decir, son de la forma: 
a A de O o ON 


donde av, 1=1,2,...,n y P habitualmente son números reales, números 
complejos o funciones. Entonces, en una ecuación lineal no pueden apare- 


cer productos o potencias de las incógnitas 11,22,...,Uj,..., Tn. 


Definición 1.56 Se llama sistema lineal de m ecuaciones con n incóg- 


nitas al conjunto de m igualdades: 


n 
b;¡ = y para 1=1,2,...,m, (1.30) 
j=1 
donde aj¡, ¿=1,2,...,mj=1,2,...,n son los coeficientes del sistema; 
b;, 1 =1,2,...,m son los términos independientes, Y 11, T2,...,Uj,==., 


Tp son las incógnitas del sistema. 


El sistema de ecuaciones (1.30) puede escribirse en forma matricial como 


sigue: 
0a11 2 015 da Cin 1 bi 
01 ... Or; ... Cin Li = bj . (1:31) 
Aml +... Umj «.. mn Tn Br 
A XxX = db 
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donde A es la matriz de coeficientes de tamaño m X n; X € R” es el 
vector columna de las incógnitas y b E R” es el vector columna de los 
términos independientes. 

El sistema (1.31) se dice que es homogéneo cuando el vector b de 
términos independientes es nulo. Es decir, 


AX =0. 


Se conoce como sistema lineal no homogéneo general al sistema de la 
forma: 


AX =b con db 0. 


Definición 1.57 Sistemas consistentes e inconsistentes 


Un sistema de ecuaciones lineales 
AX =b (1.32) 


con A una matriz de tamaño mxn, X € R” Y be R”, se puede clasificar 


según el número de soluciones que tenga, como: 
e Inconsistente si no tiene solución. 


e Consistente si admite al menos una solución. En este caso el siste- 
ma (1.32) puede clasificarse en: 
— Consistente determinado si la solución es única. 


— Consistente indeterminado cuando hay infinitas soluciones. 


1.7.1 Método de eliminación de Gauss 


Para resolver un sistema de m ecuaciones con n incógnitas de la forma 
AX =0, 


se procede de la siguiente manera: 
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> 


1. Se forma la matriz aumentada B = (4] 5) 


2. Se aplican operaciones elementales entre filas, hasta llevar a B a 
una matriz escalonada reducida C. 


3. Se halla el sistema de ecuaciones que representa la matriz C. 


4. El último sistema determina la solución. 


Por último, en esta sección se presenta la aplicación de determinantes, 
bien conocida para resolver sistemas de ecuaciones lineales AX = b, donde 
A es una matriz invertible de tamaño n x n. Sean 


il  ... 015 «-- ln b1 
421 +... 02 ... 0Q2n > ba 
A = y b= 
les va A 2 nal Bn 
Para j =1,2,...,n, denotemos por Bj; la matriz que resulta de sustituir 
la columna ¿-ésima de A por el vector b: 
d1i =.< Bijor Di Ojal ... dm 
dal ... 02,5 == ba 02,5 +1 +... 0% 
Bj = . a , (1.33) 
Unl ... Un,j=1 Br, Un,j+1 <.. nn 


Teorema 1.38 Regla de Cramer 
Consideremos el sistema AX = b, donde A es invertible. Entonces, la 


solución del sistema viene dada por 


il det B; 

ze 12 1 det B> 
== | Eo 1.34 
det A . ( ) 

Tn det B,, 


donde las matrices Bi, Ba,..., Bn, están definidas en (1.33). 


Demostración. 
Queda como ejercicio para el lector. M 
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1.8 Transformaciones lineales 


Definición 1.58 Sean V y W espacios vectoriales reales. Sea T': V = 
W una función de V en W. Se dice que T' es una transformación lineal 
de V en W si y solo si para cualquier u, Y vectores de V y a escalar, se 


tiene que: 
T(ú+0v6) =T(ú) +T(u) y  T(aú) =0T(u). (1.35) 
Teorema 1.39 Sea T una transformación lineal de V en W. Entonces: 
£-T(0)=0. 
2. T(-ú) =-—T (u), para todo u € V. 


n 
3. Si 0= Y) Qq4u;, con u; € V y a escalares, entonces: 


¿=1 
n n 
T (E 05) = y au: 
¿=1 ¿=1 
4. Si el conjunto [U1, U2,...,Um) es linealmente dependiente en V, en- 


tonces el conjunto [T (01), T (02),..., T (Un) ) es linealmente de- 
pendiente en W. 


Demostración. 
Queda como ejercicio para el lector. M 


1.8.1 Representación matricial de una transformación 


En este apartado se verá que para toda transformación lineal T' : V —= W, 
existe una matriz A de tamaño m x n con m = dim W y n = dim V tal 
que: 


TA] = AX para todo Ze V. 


Este hecho es sumamente útil, ya que permite determinar de manera fácil 
el núcleo, la imagen, la nulidad y el rango de una transformación lineal. 
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Teorema 1.40 Sean V y W espacios vectoriales reales de dimensiones 
n y m, respectivamente. Sea T : V —= W una transformación lineal. 


Entonces existe una matriz única de tamaño mx n, Ar tal que: 


T(%) = Arí para todo eV. 


Demostración. 
Queda como ejercicio para el lector. M 


Definición 1.59 Matriz de transformación 
La matriz Ay en el Teorema 1.40 se llama matriz de transformación 


correspondiente a T' o representación matricial de T. 


Teorema 1.41 Sea Ar la matriz de transformación correspondiente a la 


transformación lineal T'. Entonces: 


1) Imp =J1maA = Col (Ar). 21) p(T) = p(Ar). 
íti) ker(T) = ker(Ar). iv) v(T) =v(Ar). 
Demostración. 


Queda como ejercicio para el lector. M 


Definición 1.60 Transformación uno a uno 
Dada una transformación lineal T' : V — W, se dice que es uno a uno 


si satisface que: 
T(5,) == T (02) implica que U = 02. (1.36) 


Es decir, T es uno a uno (escrito 1—1) si y solo si todo vector U en la 


imagen de T' es la imagen de exactamente un vector en V. 
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Definición 1.61 Transformación sobre 
Sea T : V — W una transformación lineal. Entonces T' es sobre, si 
para todo w € W existe al menos una v € V tal que T(5) = 4%. Es decir, 


T es sobre si y solo si Imp = W. 


Definición 1.62 Isomorfismo 


Sea T': V — W una transformación lineal. Entonces T' es un isomor- 


fismo si T' es uno a uno y sobre. 


1.9 Matrices con entradas complejas 


En esta sección se desarrollarán algunas de las propiedades de las matrices 
cuyos elementos son números complejos. Toda la aritmética y los teoremas 
que se han expuesto se aplican a matrices complejas. Estas matrices tienen 
importantes aplicaciones, por ejemplo, en la mecánica cuántica. 


1.9.1 Definición y propiedades básicas 


Definición 1.63 Matriz compleja 
Una matriz A de tamaño m x n se dice que es una matriz compleja 


si sus elementos son números complejos. 


Definición 1.64 Matriz conjugada 
Sea A = la¡¡] una matriz compleja, se llama matriz conjugada de A a 


la matriz Á = [a;;], donde a; es el conjugado complejo de as. 
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Ejemplo 1.9 Determine la matriz conjugada de la matriz compleja 


2-31 2+1 
A= 


2=21 21 


Solución. 


ia 2-4 2+1 | _ [243 2=2 
2-1 21 24 -—2 | 
Teorema 1.42 Propiedades de la conjugada compleja 


Sean A y B matrices de componentes complejas de tamaño mx n y 


sea a EC. Entonces: 


1, 4A+B=A+B. 2. Á=A4. 3. At=A'. 
4. QaA=uúA 5. AB=AB, men 
Demostración. 


Sean A = [a;¿] y B = lb;¡], entonces 


1. A4+B= [ass + bs] = [az; + by] =A+B. 


[a;;] = [a¡] = A. 


A 
3. Queda como ejercicio para el lector. 


4. aA= [aa] = [a7,] = 9. 


5. Definamos C = AB, luego el conjugado del elemento Cc; es 


Gh = ibi + Uiobar +. + Gindak 


n n n 
=> dijbjn = Y aidjn = Y 05 Din 


A=il Sl 1 
= U%i1b1x + Ui2bax +... + Gindnk. 
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Definición 1.65 Transpuesta conjugada La transpuesta conjugada 


de una matriz compleja A, denotada por A*, se define como: 
AF = At, (1.37) 


donde los elementos de A son los conjugados complejos de los elementos 


correspondientes de A. 


Ejemplo 1.10 Determine A* para la matriz 


4 +31 pas! 
A=|2-¿ 6í 
—1 La 
Solución. 
4+3 2+1 4-3 2-1 
A = 2-14 61 = 2+14 —61 
=1 1+3 —-1 1-3 


Am SA = 


Teorema 1.43 Propiedades de la transpuesta conjugada 
Si A y B son matrices complejas de tamaño mxn y a € C, entonces 


se cumplen las siguientes propiedades: 


1. (AB) =A. 2. (A+ B)"=AP+BY. 
3. (a A" =x% 4*. 4, (ABE=BP AP, m=n. 
Demostración. 


Queda como ejercicio para el lector. M 


Teorema 1.44 Sea A una matriz compleja de tamaño n Xx n, entonces: 


det(4) = det (4). 
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Demostración. 
La prueba se hará por inducción sobre n. Sea A = [a] una matriz de 
tamaño 1 x 1, entonces es claro que 


det(A) = a =det(A). 


Ahora, supongamos que el teorema es cierto para matrices de tamaño 
(n—1) x (n— 1). 

Sea A = [a¡¡] una matriz de tamaño n x n. Si se calcula el det(4) por 
la k-ésima fila, se tiene que 


n 


det(A) = Y > ar¡Cj(A) = Y (Dag Mi5(A), 


j=1 j=1 


donde My¿(A) es el menor complementario (k, q Por la hipótesis de 
inducción, se verifica que 


Por lo tanto, 


det(A) = (DF 0xjMa5(A) o DAM (A) 


j=1 j=1 

= Y (Da Mi(A) = Y (Da ¡Mi (A) 
j=1 j= 

= det(4). m 


1.9.2 Espacios vectoriales complejos 


Las propiedades algebraicas de un espacio vectorial complejo arbitrario 
son muy semejantes a las estudiadas para los espacios vectoriales reales. 
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Definición 1.66 Espacios vectoriales complejos 

Un espacio vectorial complejo se define exactamente como un espacio 
vectorial real (definición 1.36), excepto que los escalares en los axiomas 
(vi) a (ix) pueden ser números complejos. Los términos espacio vectorial 
complejo y espacio vectorial real destacan el conjunto del cual se eligen 


los escalares. 


Los conceptos de combinaciones lineales, conjuntos generadores, de- 
pendencia lineal, independencia lineal y base no cambian para los espacios 
vectoriales complejos, excepto que utilizamos escalares complejos. 


Definición 1.67 Producto interno en C” 


Sean u,v € C”, se define el producto punto U - Y como 


donde u, es el i-ésimo elemento conjugado de ú y v; es el 1-ésimo elemento 


> 


de U. 


Teorema 1.45 Propiedades del producto punto en C” 


Para todo 4,1, WE C"” y todo a EC: 


1) ua 0. 11) ú-ú=0si y solo si ú=0. 


> 


di) u-0=U-4. iv) (1440) -U=1U-U+U-0. 


Demostración. 
Queda como ejercicio para el lector. M 
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Definición 1.68 Partes real e imaginaria de un vector complejo 

El complejo conjugado de un vector complejo ú € C” es el vector ú € 
C”, cuyas componentes son los complejos conjugados de las componentes 
de ú. Las partes real e imaginaria de un vector complejo u son los vectores 
Re(u) € R” y Im(u) € R”, respectivamente, formados a partir de las 


partes reales e imaginarias de cada una de las componentes de u. 


Ejemplo 1.11 Determine las partes real e imaginaria y el correspon- 


diente vector conjugado del vector ú * = (—i,1+1,1). 


Solución. 
Como 
—i 0 —-1 
YA = 1 + 2 = 1 + 2 1 , 
1 1 
entonces 
0 —-1 
Rea) = |1 y Im(u) = | 1 
1 0 
Luego, el vector conjugado es 
E 0 —1 1 
1 0 1 


1.9.3 Solución de sistemas lineales con entradas complejas 


Los resultados y las técnicas para resolver sistemas lineales, presentados 
en la sección 1.7, se pueden aplicar de manera directa a los sistemas 
lineales con coeficientes complejos. En este apartado, se muestra cómo 
transformar un sistema lineal de n x n con coeficientes complejos en un 
sistema lineal 2n x 2n con coeficientes reales. 

Consideremos el sistema 


AX =5, (1.38) 
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donde A es una matriz compleja de tamaño n x n, a a be Cr. Entonces, 
el sistema dado en (1.38) se puede escribir como 


(neta) e] [na | Ñ 


Im(A) Re(A) Im(z) 


Re(1) 
rm(%) 


donde Re( .) y I ml .) denotan las partes real e imaginaria, respectivamen- 
te. Este nuevo sistema lineal con coeficientes reales es de 2n ecuaciones 
con 2n incógnitas. Si se emplean los resultados de la sección 1.5, se tiene 
que el sistema dado en (1.38) tiene una única solución si y solo si 


? 


det (Re(4)) 40 y det (Re(A) + Im(A)[Re(4)] "Im(A)| 40. 
En cuyo caso la solución está dada por 


[neta] 


ImB) 


Tr [Re(A)] *Im(A) 
—|Re(A)] “Im(A) La 


C—Re(b) 
C-*Im(b) 


y) 


donde /,, es la matriz identidad de tamaño n x n y la matriz 


C = Re(A) + Im(A) [Re(A)] *Im(A). 
Ejemplo 1.12 Determine una solución del sistema de ecuaciones: 


(2-01 + (1-32 =3- 6í 


(1.39) 
(3+ 401 + (2+21)22 =7+1. 
Solución. 
Al expresar matricialmente (1.39), se llega a 
2-4 1-4] [0] [3-65 
ee me] ell eo 
Como 
2-14 1-2 2 1 1 -1 Ñ 
A= ER | => 3 > +1[, Al = Re(A) +1 Im(A). 


De manera análoga, el término independiente se puede expresar 


[re = ll +L: 
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Si 11 = a1 +1b, y 22 = 49 + iba, entonces (1.39) se puede reescribir como 


Re(A) : —Im(A) Re(z) - Re(b) 
Im(a) ¿ re(ay | mil Lim(») 
EN 8 
Sia : 7 
e 

1233 2 


Para hallar C, se realizan los respectivos productos y se llega a 
0 -2 
C = he al y detC =20% 0. 


Por otra parte, el determinante de Re(A) = 1% 0. Luego, el sistema 
tiene única solución y está dada por 


Por tanto, la solución del sistema lineal dado es 


xi =1-2 y zo =2+1. 


Capítulo 2 


Vectores característicos 
y valores característicos 


En una gran variedad de aplicaciones, dada una transformación lineal 
T : V => V, resulta útil encontrar un vector Y en V tal que TY y Y sean 
paralelos. Esto es, se busca un vector Y y un escalar A tal que 


T0=» (2.1) 


tenga una solución Y O. En este caso, A se denomina valor caracterís- 
tico de T' y U se llama vector característico de T' correspondiente al valor 
característico A. Si dim(V) = n, el problema de determinar los respec- 
tivos valores característicos de 1' puede resolverse con la ayuda de los 
determinantes. Nótese que la ecuación (2.1) puede escribirse en la forma 


(T — A1,)0 =0, 


donde /,, es la transformación identidad. Si denotamos 1, = T' — Al», 
entonces Á es un valor característico si y solo si la ecuación 


Tv) =0 (22) 


tiene una solución Y no nula, en cuyo caso T1 no es invertible, pues una 
solución no nula de (2.2) existe si y solo si la matriz de T, es singular. 
Si A7 es una representación matricial de T', entonces Ar — AÍ,, es una 
representación matricial para 7. Por esta razón, en este capítulo se estu- 
diarán algunas de las propiedades de los valores y vectores característicos 
de las matrices de tamaño n Xx n. 
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2.1 Valores propios y vectores propios 


Definición 2.1 Valor característico y vector característico 
Un vector característico de una matriz A de tamaño nx n es un vector 


U diferente de cero, que cumple: 
Av = Av (2.3) 


para algún escalar A. El escalar A es llamado valor característico de A 
si existe una solución no trivial v del sistema Av = Av. También, U se 


denomina vector característico correspondiente a A. 


Nota 2.1 Los valores característicos se llaman también autovalores, va- 
lores propios o eigenvalores, y los vectores característicos, autovectores, 


vectores propios o eigenvectores. 


Teorema 2.1 Sea Y un vector propio de una matriz A asociado al valor 
propio A. Sea a. % 0, entonces au también es un vector propio de A 
correspondiente al valor propio A. 


Demostración. 
Se debe probar que av satisface (2.3). Utilizando el hecho de que 
AU = AV, se tiene que 


A(av) = a(Av) = a(A0) = A(ad), 


lo cual completa la prueba. Mm 


Ejemplo 2.1 Verifique si los vectores ú* = (-1,1) y v* = (2,1) son 


vectores propios de la siguiente matriz: 


A= 
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Solución. 
Se tiene que 


E 1 2 (A. 1] _ 5 
a 
>, [1 2[2| [4 2 
lol Ll 
Así, u es un vector propio correspondiente al valor propio A= —1, pero Y 


no es un vector propio de A porque AY no es un múltiplo de 7, es decir no 
existe un escalar Á tal que 24 = 4 y A = 14 se verifiquen simultáneamente. 


Ejemplo 2.2 Considere la matriz A dada en el Ejemplo 2.1, muestre que 


6 es un valor propio de A y encuentre el vector propio correspondiente. 


Solución. 
El escalar 6 es un valor propio de A si y solo si la ecuación 


Av = 6v, (2.4) 
tiene una solución no trivial. Pero (2.4) es equivalente a AY — 67 = 0, o 
(A-61)5=0 (2.5) 
Para resolver esta ecuación homogénea, se forma la matriz 
ed 03-E3 
Las columnas de A— 61 son linealmente dependientes, es decir (2.4) tiene 


solución no trivial; luego, 6 es un valor propio de A. Para encontrar el 
vector propio correspondiente, se realizan operaciones por fila 


E 5 a 
52 | 0sm+.|0 0 | 0] 


1 
La solución general tiene la forma | a x. Según el Teorema 2.1, cada 


2 
vector de esta forma con x % 0 es un vector propio correspondiente a 


A =6. 


72 2. Vectores característicos y valores característicos 


Teorema 2.2 Sea A = la;¡] una matriz real de tamaño n x n e I, la 
matriz identidad de tamaño n x n, entonces la función palA) es definida 


por la ecuación 
pa) =det(4— AL.) = Y tra) (Cayos, (2.6) 
k=0 


donde tri(A) denota la suma de los determinantes de las submatrices 
principales de orden k, [tro(4) =1 y trn(A) = det(4)], es un polinomio 
en A de grado n y el término independiente es pa(0) = det(A). 


Demostración. 

Vamos a demostrar que pa(A) es un polinomio de grado n únicamente 
para el caso n < 3. La demostración para el caso general puede hacerse 
por inducción. 

Para n = 1, el determinante es el polinomio lineal pa(A) = a11 — A. 
Para n = 2, se tiene que 


=A 012 


pal) = det(a A) = A 


= »2 (a11 a22) A | (a11492 NN 412491) =»M — tri (AJA + det (A). 


a > (ar1 — Aj(a22 — A) — a12091 


Obsérvese que el polinomio obtenido es de segundo grado en A. Para 
n = 3 tenemos 


a1=A 412 413 
PA(A) = det(A = Al3) = 091 a4929 — A 023 
431 d32  3z=A 


(ar — A)(as2 — A)(az3 — A) + 412423431 + 013091032 


— laz2a23(a11 — A) + a13031 (092 — A) + a91a12(a33 — A)] 


3 
= - tn (AJA — (O Mis (A))A + det(A), 
¿=1 
donde M;¿¿(A) denota el menor complementario (i,1) de A. Nótese que en 
este caso se obtiene un polinomio de tercer grado, siendo el término de 
mayor grado —A?. 


La afirmación pa(0) = det(A) resulta inmediata de la definición de pa. 
E 
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Teorema 2.3 Sea A una matriz real de tamaño n xn. Entonces Á es un 


valor propio de A si y solo si 


PA(A) = det (A — Aln) =0. (2.7) 


Demostración. 

Supóngase que A es un valor propio de A. Entonces existe un elemento 
7 4 0 tal que AU = A%, de donde A9— A9= 0 o (A— Al,)5 = 0. Por 
lo tanto, A — AÍ,, tiene un núcleo no nulo y A — AÍ,, no es invertible, es 
decir det(A — Al.) =0. 

Recíprocamente, supóngase que det (A — AL») = 0, es decir A — Al, 
no es invertible. Entonces A — A/,, debe tener un núcleo no nulo, lo que 
significa que existe un elemento Y 4 O tal que (A —- AL) 0 = 0. Por lo 


tanto, AU— AUv=00 AU= AU. Así, A es un valor propio de A. Mm 


Definición 2.2 Ecuación y polinomio característico 
La ecuación (2.6) se llama polinomio característico de A. La ecuación 


(2.7) se llama ecuación característica de A. 


Definición 2.3 Multiplicidad algebraica 

Sea Aj un valor propio de una matriz A de tamaño n xn. Entonces, la 
multiplicidad algebraica de Az es el número de veces que Aj aparece como 
raíz del polinomio característico de A; es decir, es igual a su multiplicidad 


como raíz de la ecuación característica. 


Ejemplo 2.3 Encuentre el polinomio y la ecuación característica de 


74 2. Vectores característicos y valores característicos 


Solución. 
Fórmese A — Af y calcúlese su determinante 


do 
det(A-AM=| 2  1-A 6 
2 dad E 
1-1 6 26 2 A 
= (4-03 NS ¿eos 2 


= omite Med. 8-01) Ppe9=21=2]: 


Simplificando el producto, se obtiene el polinomio característico 
val == 2131 <d04 +36. 
Los resultados del Teorema 2.2 se cumplen, ya que la tri(4) = 13, 


3 
Y Mi(A) = 40 y el det(4) = 36, y factorizando pa, se llega a 
¡=1 


pA(A) = (A YA — 9). 
En este caso, la ecuación característica es 
(A=214=9) =0 


Nótese que el valor propio 2 tiene multiplicidad algebraica 2 pues (A — 2) 
aparece dos veces como factor del polinomio característico. 


Teorema 2.4 Sea A una matriz real de tamaño n xn con valores propios 


distintos A1,A2,..., Am. Sea 
Bi =[(08€C"”: Ad= AgU) para == Ln, (2.8) 


entonces para cada k, Bj = ker[ A — AL) es un subespacio de C”. 


Demostración. 

Como AO = Az0 para todo k, 0 € Bs. Si Az no es un valor propio, no 
existen vectores Y % O excepto 0 que satisface A% = AzU. En este caso, 
By, es el subespacio trivial. 

Ahora supongamos que Az es un valor propio. Entonces existe un 
740 tal que AY = Az, en otras palabras (A — AD)U = 0. De esta 
manera, Bj, = (U € C” : (A— ApI)U = 0) es el espacio solución del 
sistema homogéneo (A — Ap 1)U = 0, el cual es un subespacio de C”. m 
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Definición 2.4 Espacio propio 
Sea Az un valor propio de A. El subespacio Bj. se denomina espacio 


propio de A correspondiente al valor propio Ay. 


Teorema 2.5 Sea A una matriz real de tamaño n x n. Entonces los 
espacios propios correspondientes a valores propios distintos de A tienen 


al vector nulo en común. Es decir, Bj N Bb, = (0 si. Ak Á Ar. 


Demostración. 
Supongamos que existe un vector propio de A tal que Y € By y U € B,., 
entonces por (2.8) se tiene que 


Av = AU y Av = AyU. 
Luego, 


(Az — ApJú =0, 


pero como Az % Ar, se concluye que U = 0; por lo tanto, Bj NB, = (5) 
y la prueba queda completa. Ml 


Teorema 2.6 Si U,,...,Um son vectores propios correspondientes a va- 
lores propios distintos Aj,...,Am de una matriz A de tamaño nx n, 
entonces el conjunto [U1,...,Umy es linealmente independiente. 
Demostración. 


La demostración es por inducción sobre m. El resultado es tri- 
vial cuando m = 1. Entonces supongamos que se ha demostrado para 
cualquier conjunto m = k de vectores propios. Sean 01,...,0+1, k+1 
vectores propios pertenecientes a valores propios distintos y supongamos 
que existen escalares c; tales que 


c¡0; =0. (2.9) 
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Si se multiplica por A a ambos lados de (2.9) y se utiliza el hecho de que 
AU; = A¡U;, se obtiene 
k+1 


yd CiA¡Ui = 0. (2.10) 


i=1 


Al restar de (2.10) el producto de (2.9) por Az +1, se obtiene la ecuación 


k 
Y eAr — Ap +1) =0 
i=1 
Como los vectores U,,...,U¿ son linealmente independientes por hipótesis 
de inducción, se debe tener que c¿(A¡—Ax + 1) = O para cadai=1,2,...,k. 


Además, como los valores propios son distintos, se tiene que A; % Ak +1 
para i 4 k+l, así que c; = 0 para 1 = 1,2,...,k, y de (2.9) se tiene 
que cx +1 es también 0. Por lo tanto, el conjunto de vectores propios 
Ul,...,U +1 es también linealmente independiente. MH 


Teorema 2.7 Los vectores no nulos tomados de espacios propios distin- 
tos son linealmente independientes. En otras palabras, los espacios pro- 
pios B,,Ba,...,B,, (correspondientes a los valores propios A1,A2,..., Am 
distintos) cumplen que 

“Si 1 +...+ Um =0 con úx € Ba entonces Uy =...=m=0.” 


Demostración. 

Supongamos que d¡ +...+%y = 0 con ús € By, esto es Aly = ApUz. 
Si algunos uz no fueran 0, ellos serían vectores propios de A, correspon- 
dientes a valores propios distintos, entonces el que la suma de ellos sea U 
contradice el Teorema 2.6. Mm 


Definición 2.5 Multiplicidad geométrica 

Sea Ay un valor propio de una matriz A de tamaño nx n. Entonces la 
multiplicidad geométrica de Ay es el número máximo de vectores propios 
de A linealmente independientes que tienen un valor propio igual a Ap. 
Es decir, es igual a la dimensión del espacio propio correspondiente a Ay 


(lo cual es la nulidad de la matriz A— AxI). En consecuencia, 
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multiplicidad geométrica de A. = dim(B;.) = v(A — plo. 


Nota 2.2 La multiplicidad geométrica de un valor propio nunca es cero. 
Esto se establece de la Definición 2.1, la cual expresa que si A es un valor 
propio, entonces existe un vector propio no nulo correspondiente a A. 


A continuación, se presenta un procedimiento para calcular los valores 
propios y vectores propios de una matriz A de tamaño n x n. 


Determinación de valores propios y vectores propios 


i) Encuentre pa(A) = det(A — AJ). 
li) Halle las raíces A¡,A2,..., Am de palA) =0. 


iii) Resuelva el sistema homogéneo (A — A¿1)ú = 0, correspon- 
diente a cada valor propio Ap. 


Ejemplo 2.4 Encuentre los vectores propios y espacios propios asociados 
a la matriz dada en el Ejemplo 2.3. 


Solución. 
En el Ejemplo 2.3, se obtuvo que la ecuación característica era 


(A=D*(A 9) =0. 


De esta manera, los valores propios de A son A1 = 9 y A2 = 2 (con 
multiplicidad algebraica 2). 


Para A¡ = 9, se tiene 


3 -1 6| |z 0 

— Y = = Y = 
(A-9M)u=|2 3 6 0 
2 -1 [1||z 0 


Para determinar el vector propio correspondiente, se realizan operaciones 
por filas 


5-1 6 J0 1 -4 3 ]0 1. 4 3 ]|0 
2.3 6 J0| = [5-1 6 J0[ <= [0 -21 21 |0 
2 A al a] 4 [SA A (012 lo 7 < [0 
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taa 0 1.0 1 ]0 
o [0 1-1 0), [o 1 1 J0 
A AO 


La solución general corresponde a 1 = z, y = z, luego el vector propio 


1 
tiene la forma |1| z. Cada vector de esta forma con z 4 0 es un vector 
1 
il 
propio correspondiente a A¡ = 9. Por lo que B¡ = gen 1 
il 


Para A2 = 2, se obtiene 


2 1 6| |z 0 
(A-2D5=|2 -1 6| ly| =]0 
2 1 6| |z 0 


Para encontrar el vector propio correspondiente, se realizan operaciones 


por filas 
2 16]0 2 16]0 
21.6 | 0 7,0 0 0 | 0 
2 16 ]|0|X%-H5]|0 0 0 ]|0 
La solución general corresponde a y = 2x + 6z, luego el vector propio tiene 
1 0 
la forma |2| +|6| z. Cada vector de esta forma con x, z 4 0 es un vec- 
0 1 
1 0 
tor propio correspondiente a A2 = 2. Por lo que Ba = genx |2| , |6 
0 1 
Teorema 2.8 Sean A1,A2,..., Am valores propios distintos de la matriz 
A. Si para cada k =1,2,...,m, Si es un conjunto linealmente indepen- 


diente de vectores propios de A correspondientes a Aj, entonces: 


S=S¡US23U...U Sm 


es todavía un conjunto de vectores linealmente independiente. 


2.1. Valores propios y vectores propios 79 


Demostración. 

Sea Sp = [Up1,»--,Trr, ) un conjunto linealmente independiente de 
vectores propios de la matriz A, correspondiente al valor propio Az (para 
cada k € [1,2,...,m)). 

Para probar que S = 51US23U...US,, es linealmente independiente, 
consideremos una combinación lineal de los vectores en esa unión tal que 


(01111 OA Gte Etr,) a (dd Hb dante) =0. 
A A AAA A 
en B; en B,, 


Por el Teorema 2.7, se puede afirmar que cada suma entre paréntesis es 
0. Como los vectores que participan en cada una de esas sumas son line- 
almente independientes, entonces se concluye que los coeficientes tienen 
que ser nulos, lo cual prueba que S es linealmente independiente. MM 


La prueba del siguiente enunciado no es difícil si se explican algunos 
otros resultados. Su demostración se realiza en la siguiente sección. 


Teorema 2.9 Si A, es un valor propio de una matriz real A de tamaño 


n xn, con multiplicidad algebraica r, entonces: 
1 < multiplicidad geométrica de A < multiplicidad algebraica de Ap. 


Teorema 2.10 Sea A una matriz no singular de tamaño n Xx n, con 
valores propios no nulos A1,A2,..., An y vectores propios U],U2,..., Un: 


La matriz inversa A7! tiene: 
¿) Los valores propios de la forma 1/A1,1/A2,...,1/An. 


11) Los mismos vectores propios de A. 
Demostración. 
¿) Si los valores propios de A son diferentes de cero, entonces 
PALA) = det (A - AL.) = det [A(L, — A47?)] 


(03) 


= det A det 
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pA(A) = (-A)” det(4) det ES = st») 


= (17 det(A)py (5) 


Luego, se deduce que 1/A es un valor propio de 47! por cada valor 


A de A. 
i) Si Aú= Au entonces premultiplicando por 47!, se tiene 
AT(Añ) =A47*(M) 
ú =AA gd puesto que AX 0. 


ú =A du, 


por lo tanto, U es también un vector propio de 47!. mm 


2.1.1 Descomposición de Sylvester 


En la siguiente sección se presenta una descomposición útil para matrices 
cuadradas; esta importante descomposición fue dada por Sylvester. 


Definición 2.6 Matriz de proyección espectral 

Sea A una matriz real de tamaño n x n que no tiene valores propios 
múltiples y sean Uy, wi los vectores propios a derecha e izquierda de A, es 
decir los vectores propios de A y A* asociados al valor propio real Aj. Se 


define la matriz de proyección espectral correspondiente a cada Az como: 


mit t 
EM) = == ==. (2.11) 


Ejemplo 2.5 Encuentre las matrices de proyección espectral de la si- 


guiente matriz: 
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Solución. 
La ecuación característica asociada a la matriz A es 


A + 12? — 291 +18 =-—(A-— 1)(A— 2)(A— 9) =0. 


De esta manera, los valores propios de A son A1 =1,A2=2 y A3=09. 


Para A = 1, se tiene 


3-1 6] [ox 0 
(A-Dv=|8 0 Ol [yl =]0 
3-1 6] l2 0 


Para determinar el vector propio correspondiente, se realizan operaciones 


por filas 

3160 3156J|0 0-16 ]|0 
8 00] 0) >, [1.00] 0 =  [1.0.0]0 
3-1 56| cae 0D] *e do 6.0 


0 Fa ¿Pa 0 


La solución general corresponde a x =0 y y = 6z, luego el vector propio 


0 
tiene la forma |6| z. Cada vector de esta forma con z 4 0 es un vector 
1 
0 
propio correspondiente a A¡ = 1. Por lo que B¡ = genx |6 
jl 
Para A2 = 2, se obtiene 
2 -1 6| |z 0 
(A-2D)ú = |8 -1 0| ly| =|0 
3-1 5| |z 0 


Para encontrar el vector propio correspondiente, se realizan operaciones 
por filas 


2 161]0 6.0 6 | 0 
81.0 | 0 PA 8-1 0 | 0 
3-15 | 00%-R |1 0 41]. 0 
La solución general corresponde a y =8x y z = 2, luego el vector propio 
1 
tiene la forma |8| x. Cada vector de esta forma con x 4 0 es un vector 
1 


propio correspondiente a A2 = 2. Por lo que Ba = genx |8 
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Para Az = 9, se tiene 


5 1 6| zu 0 
(A-9N)0 =|8 8 0| [y| =]0 
3 1 2|lz 0 
Para encontrar el vector propio correspondiente, se realizan operaciones 
por filas 
53 1.6 .]|0 5 1.6 |0 
88 0 | 0 e 11.00 
IS O | 0 


im 18 0 8 | 


La solución general corresponde a y = 1, z = 2, luego el vector propio 


dl 
tiene la forma |1| x. Cada vector de esta forma con x 4 0 es un vector 
1 
1 
propio correspondiente a A3 = 9. Por lo que B3 = gen 1 
jl 


Las matrices A y A? tienen los mismos valores propios y realizando 
el mismo procedimiento descrito anteriormente, se tienen los siguientes 
vectores propios para la matriz A? asociados a los valores propios Aj = 
1, 2 =2 y A3 = 9, respectivamente, 


-1 a) 2 
wi = 0 , 15) = 1 y w3 = |-1 
1 6 6 


Luego, las matrices de proyección espectral E(A;) son 


0.0.0 ¿e 1 y [2 16 
E(1) = [-6 0 6|, E(2) =_|40 8 48] y E(9) =,|2 -1 6 
A 01 5 1 -6 2 1 6 


3 
El lector puede verificar que »7 E(A) =L3. 
¿=1 


Teorema 2.11 Sea A una matriz real de tamaño nxn que no tiene valo- 
res propios múltiples, entonces los vectores propios a derecha e izquierda 


asociados a valores propios reales distintos de A son ortogonales. 
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Demostración. 

Sean Y, y w, los vectores propios a derecha e izquierda asociados a 
valores propios reales distintos A; y Aj, respectivamente. Para comprobar 
que Y; - 1%, = 0, se calcula 


= (43,)'w, puesto que Y, es un vector propio de A 
(v 4%) w, =0!(4'w,) reagrupando términos 
. (AU; ya que 4; es un vector propio de A 


= yO; = Aj(0, > 05). 


Luego (A; — A¿)Ú; - 10 =0 y como A¡— Aj 4 0, entonces 0; - W¿=0. M 


Teorema 2.12 Sea A una matriz real de tamaño n xn con valores pro- 
pios reales distintos A1,A2,..., An, entonces las matrices de proyección 
espectral E(A;) definidas en (2.11) satisfacen las siguientes propiedades: 
a) E(A)E(y) = e b) > E(Ax) = Zn, 
0) s14 3]. k=1 
c) Cada E(A;) conmuta con A, es decir AE(A;) = E(A;) 4. 


Demostración. 


a) Sean U, y w; los vectores propios a derecha e izquierda asociados 
a valores propios reales distintos A; y Aj, respectivamente. Por el 
Teorema 2.11 estos vectores son ortogonales, por lo tanto de la 
definición de E(Az) dada en (2.11), se tiene 


A e > 1h, 
VW; UGW; VO > W; 
E()E(y) "aaa e O Ia O, 
¿Y wWjoj ¿Yi J 
de manera análoga 
DW! ta, a 
¿Wj VW _ WU W; 
ENJEN) = 3222 =%=2 =E() 
WU; WU; ¡0 0; 
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b) Queda como ejercicio para el lector. 
c) Al premultiplicar por A cualquier matriz E(Az), se obtiene 
pt Uy Ur, 


AE(Ax) = As E Mg AE, (2.12) 


y al multiplicar por A cualquier matriz E(Az), se llega a 


Uk to yt UL Ur, 
E(A,) A = Em (401) = dE ArE(A;). (2,13) 
Luego, AE(A;) e E(A,)A4 para k=1,2,...,n. E 


Teorema 2.13 Descomposición de Sylvester 


Sea A una matriz real de tamaño n x nm con valores propios reales 


distintos A1,A2,..., An, entonces A se puede escribir como 


A= $ ArE(Aj), (2.14) 
k=1 


donde la matriz E(A;) es dada en (2.11). 


Demostración. 
Puesto que cada E(A;) conmuta con A, al sumar las expresiones 


obtenidas en (2.12) y (2.13), se tiene 


n n 


Y AE(A1) => E(Ap)A = > ALE(Az) 


k= k= k=1 
_—_—_ _—_—_ 
A= Y ME(Ar), 


n 
k=1 


Y E(Ar) 


k=1 


empleando la propiedad b) del Teorema 2.12 se completa la prueba. M 
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En virtud del Teorema 2.13, se tiene que: 


1. La descomposición de Sylvester de la matriz simétrica A%A es 


(13) [105 [] 0:00 
AA = A LAA A] cos Oi, 


i=1 i=1j>1 E 


donde 05 = a 
2. La descomposición de Sylvester de la matriz simétrica 44? es 
1 a 0,0; 


ar EA ANI COS Pi; 
wi y IGTAGTA) 2)> 


i=1 ¿=13>2 


donde pi = <(w,, Ml 


Ejemplo 2.6 Encuentre la descomposición de Sylvester para la matriz 
dada en el Ejemplo 2.5. 


Solución. 
En el Ejemplo 2.5 se obtuvo que los valores propios de A eran A¡ =1, 
A2 =2 y Az =9, y las matrices E(As) fueron 


0.0.0 15 1 ¿[2156 
E(1) = [6 0 6|, E(2) =7|40 8 48| y E(9) =5 [2 -1 6 
101 51 6 2 1.6 


El lector puede verificar que A = y Ai ¡E an 
v=1 


Corolario 2.13.1 Si A es una matriz real de tamaño n x n con valores 
propios reales Az de multiplicidad algebraica rj y multiplicidad geométrica 
igual a rj, entonces A se puede escribir como 


A=5 AE*(Ar), (2.15) 
k 


donde las matrices E*(A,) vienen dadas por: 


E") = PQ) LP) POD PO 216) 
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con P(Ar) = [(D%1 Una... Ukr] y P* (Az) = (Dri DE ... Wkr] matri- 
ces de tamaño n X Try cuyas respectivas columnas son los vectores propios 


de A y A! asociados a Aj. 


Demostración. 
Queda como ejercicio para el lector. Mm 


Ejemplo 2.7 Encuentre la descomposición de Sylvester para la matriz 


dada en el Ejemplo 2.3. 


Solución. 

En el Ejemplo 2.4, se obtuvo que los valores propios asociados a la 
matriz A eran Ar =9 y A2 = Az = 2, y los respectivos vectores propios 
de Á eran 


1 1 0 
Ul = pl . U2 =|2 y U3 =|6 
1 0 1 
Por otra parte, los vectores propios de A4* son 
2 1 0 
wi = |-1 , Da = |-1 y 93 = |-1 
6 0 1 


Luego la matriz P(2) = [3 v3| y P* (2) = [a %3| , por lo tanto 


Porra -=- (raro) -7|3 1) 


entonces 
1 2 1 6 1 51 6 
E(9) = 7 2 -1 6], E*(2) = 7 2.846 
2 1 6 2 1 1 


El lector puede verificar que 


E(9) +E*(2) =£5 y JE(9) + 2E*(2) = A. 
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Ejercicios 2.1 


1. Para cada una de las siguientes matrices: 


| 
Paneles NT 


E 5. 9-12 2 3 
122 5 3 ' p 2 Ñ 1.1 ] 
i) Calcule los valores propios y los espacios propios. 
1i) Determine las respectivas proyecciones espectrales. 
iii) Encuentre la correspondiente descomposición de Sylvester. 


2. Sea la matriz A = | , con k una constante arbitraria. ¿Para 
1 1 


qué valores de k la matriz A tiene dos valores propios reales distin- 


tos? 


3. Si A es una matriz diagonal de tamaño n x n, muestre que sus 


valores propios son las entradas de su diagonal. 


4. Si A es una matriz triangular de tamaño n x n, muestre que sus 


valores propios son las entradas de su diagonal principal. 


5. Si A es una matriz real de tamaño n x n, muestre que es invertible 


si y solo si el número O no es un valor propio de A. 


6. Si A es una matriz real de tamaño n x n con la propiedad de que 
la suma de los elementos de sus filas es siempre igual a un número 


5, muestre que s es un valor propio de A. 
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7. Sea A una matriz de tamaño n xn y A1,A2,..., An sus valores 


propios, demuestre que: 


a) La matriz A? tiene los mismos valores propios. 
b) La matriz kA tiene valores propios kA1,kAg,...,kAn. 


c) La matriz A* (donde k es un entero positivo) tiene valores 


propios AR, Ab... AE. 


2.2 Matrices semejantes y diagonalización 


En la sección anterior se desarrolló parte de la terminología y de las 
propiedades de los valores propios y vectores propios. En este apartado 
continuaremos estudiando los valores propios, debido a que estos números 
son cruciales en muchas consideraciones, incluyendo las representaciones 
de matrices en ciertas formas que permiten trabajar la solución de pro- 
blemas de manera más fácil. 


Definición 2.7 Matrices congruentes 
Dos matrices reales A y B de tamaño n x n son congruentes si existe 


una matriz P no singular de componentes reales de tamaño n Xx n tal que 
A= P*BP. (2.1 


Ejemplo 2.8 Determine si las siguientes matrices son congruentes: 
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Solución. 
Veamos si existe una matriz P tal que B = P* AP. En particular, P 
puede ser una matriz triangular superior o en otras palabras, 


had 
_ Da ia 


En consecuencia, 
a =1 a(b+ 4d) =1 y ye +8bd+d =-14. 


Si se despeja b de la segunda ecuación y se reemplaza en la tercera, se 


tiene que 
1 A 1 il 
( 14) esa 14) Ed? = 3 — 15d? 
a 07 qa 


1 — 154? = -14. 


Luego d? = 1, por lo tanto la matriz P puede ser 


A CI 


Teorema 2.14 Dos matrices reales A y B de tamaño n x nm son congru- 


entes si y solo si tienen el mismo rango. 


Demostración. 
Como A y B son matrices congruentes de tamaño n x n, existe una 
matriz no singular P tal que B = PAP, entonces: 


p(B) [(P*A) P] e p(P*A) puesto que P es no singular, 


=P 
0 p(A) por ser P* también no singular. 


Aquí se utilizó la propiedad (1) dada en el Teorema 1.37. € 


Teorema 2.15 La congruencia de matrices de tamaño n Xx n cumple las 


propiedades de relación de equivalencia, es decir es 
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a) Reflexiva: A es congruente a A. 
b) Simétrica: si A es congruente a B, entonces B es congruente a A. 


c) Transitiva: si A es congruente a B y B es congruente a C, entonces 
A es congruente a C. 


Demostración. 
Queda como ejercicio para el lector. M 


Para las matrices cuadradas, además del concepto de congruencia, se 
tiene otro de mayor utilidad o generalidad: el de similaridad. 


Definición 2.8 Matrices semejantes 
Una matriz A de tamaño n xn es semejante (o similar) a una matriz 
B de tamaño n x n si existe una matriz no singular P. de tamaño n x n 
tal que 
B=P”AP. (2.18) 
De manera análoga, se dice que A y B son semejantes si y solo si existe 


una matriz no singular P tal que 
PB = AP. (2.19) 


Ejemplo 2.9 Determine si A y B son semejantes, dado que 


10 35 1 al 
A = y,  B= y  P= 
Y 2 4 E Y 


Solución. 
Se realizan los productos AP y PB: 


la 


== 
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Así, AP = PB. Como det(P) = 1 4 0, entonces P es no singular. Y por 
la ecuación (2.19), se tiene que A y B son semejantes. 


Teorema 2.16 Las matrices semejantes tienen el mismo polinomio ca- 


racterístico y, por tanto, los mismos valores propios. 


Demostración. 
Como A y B son matrices semejantes de tamaño n xn, B = PAP. 
Entonces 


B=M=P*"AP=AP"P=P[AP-AP]|=P"[4=AM]P. 
Por consiguiente, 
det(B— AL) = det[P7*(A—AL)P] = det(P7*) det(A — AL) det(P) 
= det(P7*) det(P) det(A — AL) = det(A — AL). 


Esto significa que A y B tienen la misma ecuación característica, y como 
los valores propios son raíces de la ecuación característica, entonces tienen 
también los mismos valores propios. Ml 


Ejemplo 2.10 Para las matrices A y B dadas en el Ejemplo 2.9, muestre 


que tienen el mismo polinomio característico. 
Solución. 
Tenemos que 


det(A-AD) =| =M=A=2 


3 =A 9) 


=iLohkio 
O 


det(B — AD) = 


Como det(A — AL) = det(B — AL), las matrices A y B tienen el mismo 
polinomio característico, y por lo tanto los mismos valores propios. 


Teorema 2.17 La semejanza de matrices de tamaño n x n cumple las 


propiedades de relación de equivalencia, es decir es 
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a) Reflexiva: A es semejante a A. 
b) Simétrica: si A es semejante a B, entonces B es semejante a A. 


c) Transitiva: si A es semejante a B y B es semejante a C, entonces 
A es semejante a C. 
Demostración. 
Queda como ejercicio para el lector. M 
Teorema 2.18 Si B es una matriz semejante a A con B = PLAP, 
entonces Y es un vector propio de A asociado con el valor propio A si y 
solo si P7*5 es un vector propio de B asociado con el valor propio A. 


Demostración. 
Si Y es un vector propio de A, se tiene que 


Av = Av 
(PBPD5 = Av puesto que B es semejante a A, 
B(P 75) =AP 5 puesto que P es no singular, 


lo cual completa la prueba. Mm 


Ejemplo 2.11 Para cada una de las matrices A y B dadas en el Ejem- 
plo 2.9, determine sus vectores propios. 


Solución. 
Para la matriz A, se tiene que los valores propios son A¡ = —1 y A2 = 2 


: ¿ -3 0 ó 
y sus correspondientes vectores propios son | 3 y H , Tespectivamente. 
Para la matriz B, se tiene que los valores propios son 41 = —1 y A2 = 2 

. , - 1 , 
y sus correspondientes vectores propios son | 2 y | q , Tespectivamente. 


El lector puede verificar que los vectores propios de B son iguales a 
los vectores propios de A premultiplicados por la inversa de la matriz P 
dada en el Ejemplo 2.9. 
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Con lo que se ha estudiado hasta ahora en esta sección, se puede 
presentar una demostración del Teorema 2.9. 


Demostración. Teorema 2.9 

Sea By, = [U1,U2,...,Um) base del espacio propio correspondiente al 
valor propio Az, donde m es la multiplicidad geométrica de Az. Se extiende 
By hasta completar una base de R”, digamos 


Bb = AA A Ue 


En esta base, la matriz A está particionada como 


Luego A y [4] son matrices semejantes, es decir tienen el mismo poli- 
nomio característico y los mismos valores propios con idénticas multipli- 
cidades algebraicas. Así que el polinomio característico de A es 


PALA) = PA (A) = (Ar — A) "PDAs, 


por lo tanto Az aparece como raíz de pa(A) por lo menos m veces y, por 
consiguiente, la multiplicidad algebraica de Az es mayor o igual a m. E 


Definición 2.9 Matriz diagonalizable 
Una matriz A de tamaño n Xx n es diagonalizable si existe una matriz 


diagonal D tal que A es semejante a D. 


Este resultado es muy importante ya que las matrices diagonales poseen 
muchas propiedades que permiten trabajar fácilmente con ellas, véase el 
Teorema 1.14. 


Teorema 2.19 Una matriz A de tamaño n xn es diagonalizable si y solo 
si A tiene n vectores propios linealmente independientes. En tal caso, si 
A = PDP"! donde D es diagonal, entonces los elementos de la diagonal 
de D son los valores propios de A y las columnas de P son los vectores 


propios correspondientes. 
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Demostración. 

Primero se supone que A es diagonalizable. Entonces existe una matriz 
no singular P tal que PAP = D es diagonal. Sean Aj,Az,..., An los 
elementos de la diagonal principal de D y sean U,,U2,...,Un los vectores 
columna de la matriz P, entonces 


AM 0 0 
0 Aa 0 
PD =|[0 0% Un] . l 
0.0 A 
= [A1%1 A2Ua2 ... AnD] A 
Pero como AP = [AD1 AÚ2 ... Av) y por otra parte P=1AP = D, 


se tiene que AP = PD, lo cual implica 


En otras palabras, A, = AU; para todo vector columna v;. Esto significa 
que los vectores columna 3; de P son vectores propios de A. Además, 
como P es una matriz no singular, entonces sus vectores columna son 
linealmente independientes. Así, A tiene n vectores propios linealmente 
independientes. 

Recíprocamente, suponga que A tiene n vectores propios linealmente 
independientes 1], Ua,...,U, con valores propios asociados A1,A9,..., An. 
Sea P la matriz cuyas columnas son estos n vectores propios, es decir, 
P=|l[5, U2 ... Un]. Como todo Y, es un vector propio de A, entonces 
se tiene que AU; = AU; y 


AP=A[% % ... U%)]=|u4ú Av ... And]. 


Nótese que la matriz del lado derecho de esta ecuación puede escribirse 
como el siguiente producto de matrices 


Md 0... 0 
0 Ad... 0 
E A O 
0. 0... A 
Por último, como los vectores 1],U2,...,U, son linealmente independien- 


tes, entonces P es no singular y se puede escribir la ecuación AP = PD 
como PAP = D, lo cual significa que A es diagonalizable. Mm 
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Corolario 2.19.1 Si una matriz A de tamaño n x n tiene n valores 


propios distintos, entonces A es diagonalizable. 


Demostración. 

Sean 01, U92,..., Un los vectores propios correspondientes a los n valores 
propios distintos de la matriz A. Entonces por el Teorema 2.6, se tiene 
que el conjunto (41, U2,...,0,) es linealmente independiente. Luego por 
el Teorema 2.19, A es diagonalizable. Mm 


A continuación, se presenta un procedimiento para diagonalizar una ma- 
triz A de tamaño n x n. 


Procedimiento para diagonalizar una matriz cuadrada 


Sea ÁA una matriz real de tamaño n x n. 


i) Determine n vectores propios 1,,Ua,...,0, de A, con valores 
propios correspondientes A¡,A2,..., An. Si no existen n vectores 
propios linealmente independientes, entonces A no es diagona- 
lizable. 


ii) Obtenga P como la matriz cuyas columnas son los vectores pro- 
pios obtenidos en el paso 2. Es decir, 


P= [5 Va... Un] 
iii) La matriz diagonal D = P7*AP tendrá los valores propios 
A1,A2,-.., An en su diagonal principal (y ceros en el resto). La 


ubicación de los vectores propios en la matriz P determina la 
posición en que aparecen los valores propios sobre la diagonal 


de D. 


Ejemplo 2.12 Determine si la matriz dada a continuación es diagona- 


lizable: 
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Solución. 
La ecuación característica asociada a la matriz A es 


A AS MAD? <= 0 


Luego, los valores propios son A; = 0 y A2 = 2 (de multiplicidad alge- 


-1 
braica 2). El vector propio correspondiente a A¡ =0es %, = | 3| y los 
1 
2 3 
correspondientes a A2 =2 son va = | 1| y 43= |0| . Entonces 
0 1 
1.23 1 1.23 
P=|3 1.0 y E E 
1.01 1.2.5 
luego 
111.23 3 2 3||-1 2 3 
ERAS 3 4 9||-3 4 9||3 10 
1.2 5||-1 2 5 1.01 
112 3 |0 4 6 1 0.0.0 
== [9% 310 < 05/00 
1. 2 5||0 0 2 0.04 
Por lo tanto, A es diagonalizable. 
Ejemplo 2.13 Una matriz no diagonalizable 
Determine si la siguiente matriz es diagonalizable: 
32 
AÁ= 
8 5 
Solución. 
La ecuación característica de A es 24214 +1= (A+ 1)? =0, luego 
A=-—1 es un valor propio de multiplicidad algebraica 2. Entonces, 


isis llanas : 3 MA E ñ 


va 
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as 1 
Esto lleva al vector propio Uv, = 9| Por lo tanto, A no contiene dos 


vectores propios linealmente independientes, entonces se concluye que la 
matriz A no es diagonalizable. 


Teorema 2.20 Sean A1,42,..., An valores propios distintos de una ma- 


triz A de tamaño n x n, entonces: 


Demostración. 


Como A es diagonalizable, entonces A = PDP”!, luego 


tri(4) =t[P(DP"5] =tn[(DP75P] =tr1(D) = Y Ay. 


¿=1 
Por otra parte, 


det(A) =]4] =|P(DP=5)]| =|P[DP= =|DP11P| =1D| =] [ ». 


¿= 


Ejercicios 2.2 


1. Para las siguientes matrices, determine (en caso de ser posible) una 


matriz P no singular tal que P71AP sea diagonal 


1 1 1 1 1 -1 L 2 
a b. C d. 
13 Sl 1.3 4 3 
2 2 1 3-1 4 3 1 -—1 132 
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2. Muestre que las trazas de matrices semejantes son iguales. 


3. Si A y B son semejantes, demuestre que tienen el mismo determi- 


nante. 


4. Sean A una matriz diagonalizable de tamaño nx n y P una matriz 
no singular de tamaño n x n tales que B = P7!AP sea la forma 


diagonal de A. Pruebe que 


a) B* = P-LA*P, donde k es un entero positivo. 


b) A* = PB*P"!, donde k es un entero positivo. 


a 
5. Sea Á = . Con elementos reales, demuestre que Á es diago- 


cd 
nalizable si —4bc < (a— d)? y no diagonalizable si —4bc > (a— d)?. 


2.3 Valores propios complejos 


Puesto que la ecuación característica de una matriz real de tamaño nxn es 
un polinomio de grado n, por el Teorema Fundamental del Álgebra se sabe 
que cualquier polinomio de grado n con coeficientes reales (o complejos) 
tiene exactamente n raíces (contando multiplicidades). En las secciones 
anteriores, desarrollamos la teoría para valores propios y vectores propios 
reales. En esta sección estudiaremos los valores propios y vectores propios 
complejos. 


Definición 2.10 Sea A una matriz real de tamaño n x n. El número 
complejo A es un valor propio de A si existe un vector no nulo Y € C” tal 
que 


AU=»5. (2.20) 
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Todo vector U no nulo que satisfaga (2.20) es un vector propio de A 


asociado al valor propio A. 


Ejemplo 2.14 Sea A = . Determine los valores propios y vec- 


tores propios de A. 


Solución. 
Primero se calcula el determinante de la matriz A—Al: 


dto ES Al | 


2 1=A 
= (1-12+2= [(1- A) +142] [( — A) - ¿v2]. 


De esta manera, los valores propios de A son los complejos, a saber 
A =1+:¿v2 y A =1-iv2. 


Para A =1+1v42, se tiene 


[A— (14+142)1]0= ls ¡A A = A 


Para encontrar el vector propio correspondiente, se realizan operaciones 
por filas: 


4492 1 |0 _ [244] 0 _ [2 -4y2 | 0 
2 -iyv2 | Ol ¿3 [2 ¿42 | 0O|m-m|0o 0 | 0|' 


La solución general corresponde a 24 = iv2y, luego el vector propio 


il 
tiene la forma | i a x. Cada vector de esta forma con x 4 0 es un vector 
1 
propio correspondiente a Ay =1 +42. Por lo tanto B¡ = e | Va p 


Para A2 = 1 — ¿v2, se tiene 


[A — (1 -¿V2)1]7 = ed ¡A A = A ) 
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Para encontrar el vector propio correspondiente, se realizan operaciones 
por filas 


wW2 1 |0 _ PP v42]|0 _ [2 ¿42 | 0 
2 iv2 | Ol -¿ap, [2 iv2 | 0 m-mn [0 0 | 0)” 


La solución general corresponde a 24 = —iv2y, luego el vector propio 


ll 
tiene la forma ' a x. Cada vector de esta forma con x % 0 es un vector 
0 


1 
propio correspondiente a A2 = 1 — iv/2. Por lo tanto, B) = eo uva p 


Teorema 2.21 Sea A una matriz real de tamaño n Xx n, entonces: 


¿) Los valores propios de A cuando son complejos ocurren en pares 


conjugados. 


11) Los vectores propios correspondientes a valores propios complejos, 
son conjugados complejos entre sí. 


Demostración. 


i) Si A es una matriz real de tamaño n x n, su polinomio característico 
se puede reescribir como 


PALA) = det(A — AL) = CnA" + Cp-1A"7 ds Aedo 
donde cada c¡ € R. Por lo tanto, 
pAlA) =det(A — Al,) = det (A — Al) = det(A — Al.) = pala). 


Si Ay es una raíz de pa(A), entonces 
pAldo) =PA(A0) =0. 
En consecuencia, Ag es también un valor propio de A. 


1i) Si A es un valor propio complejo de A con un vector propio corres- 
pondiente u € C”, entonces en virtud del Teorema 1.42, se tiene 


Aú =Au 
Aú =Aú 
Auú=A4. 
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Luego, ú es también vector propio de A, pero asociado al valor 
propio A. Ml 


Ejemplo 2.15 Considere la matriz A del Ejemplo 2.14 y aplique el Teo- 


rema 2.21. 


Solución. 
Para la matriz A cuyas componentes son reales, se obtuvo un valor 


1 
propio A1 = 1 +42 con vector propio asociado 1 = | i Ya] , y para el 


il 
otro valor propio Az = 1 —¿w/2, un vector propio asociado da = ' a ; 


Claramente, se nota que A2 = A y que us = U]. 


Teorema 2.22 Sea A una matriz real de tamaño 2 x 2 con un valor 
propio complejo A = a + bi (b 4 0) y vector propio correspondiente 


ú € C?. Entonces 


ARe(ú) = aRe(ú) —bIm(ú) (2.21) 
Alm(ú) = bRe(ú) + alm(ú), 


además, Re(u) y Im(u) son vectores linealmente independientes. 


Demostración. 
Sea ú € C? un vector propio de A, por lo tanto 


Aú =»Mú 
A[Re(ú) + Im(u)] = (a+ bi)[Re(ú) +1 Im(u)] 
ARe(ú) +¡AIm(u) = [aRe(u) — bIm(ú)] + i[bRe(ú) + alm(u)). 


Al igualar las partes real e imaginaria, se llega al sistema de ecuacio- 
nes (2.21). 

Además, por la Definición 2.1 se tiene que u es no nulo, luego si 
Im(ú) = 0, entonces Re(ú) 4 0, y de la segunda ecuación de (2.21), se 
tiene que b Re(u) = 0, es decir b= 0, lo cual contradice la suposición de 
que b% 0, por lo tanto Im(úu) 2 0. 
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Veamos ahora que Re(u) y Im(u) son vectores linealmente indepen- 
dientes (por contradicción). Supongamos que Re(u) = a Im(u), si se 
reemplaza en (2.21), se tiene que 


AQ Im(u) =a qa Im(u) —b Im(u) 
A Im(u) =b0 Im(u) +a Im(u). 


Si se resuelve dicho sistema de ecuaciones, se obtiene que 
(a? +1)b Im(u) =0. 


Como bX%0y Im (a) 4 0, entonces a: = +1, luego Re(u) € C?, lo cual es 
contradictorio ya que Re (a) y Im (a) cR. 2 


El corolario que se enuncia a continuación muestra que una matriz 
con componentes reales cuyos valores propios son complejos no es diago- 
nalizable. 


Corolario 2.22.1 Sea A una matriz real de tamaño 2 x 2 con un valor 


propio complejo A= a + bi (b 4 0) y vector propio asociado ú € C?, 


entonces: 
A=PRP”, (2.207 
donde 
a b 
P = Bel) Im(i) Y R = . (2.23) 
ba 
Demostración. 


Expresando el sistema de ecuaciones propuesto en (2.21) en forma 
matricial, se tiene que 
S a Ej a b 
A [Re(u) Im(ú)| = [Re(u) Im(ú)] E . ; 
es decir, AP = PR. Pero en el Teorema 2.22, se demostró que 


Re(u) y Im(u) eran vectores linealmente independientes, luego P es no 
singular. Por lo tanto, 


A=PRP"!. 4 
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Ejemplo 2.16 Expresar de la forma PRP7! la matriz: 
A= 


Solución. 
En el Ejemplo 2.14, se encontraron los dos valores propios A = 1 + 


1 
iv2 y A =1-—i y2, y los respectivos vectores propios U, = | va] y 


O E! ; 
Va = : a . Estableciendo: 


1.0 1 y2 
lao el 
el lector puede verificar fácilmente que A = PRP”!, 


Ejemplo 2.17 Encuentre las matrices P y R, de tal manera que se pueda 


expresar la siguiente matriz A como PRP7! : 


29 9 a 


66 -164 51 


Solución. 
La ecuación característica de A está dada por 
det(A—AI) = —A%+ 1504? — 81254 + 312500 
= — (A — 100)(A — 25 + 50 ¿)(A — 25 — 50 2) =0. 


Por lo tanto, los valores propios son A; = 100, A2 = 25— 50 1 y Az = Az. 
Para A¡ = 100, se resuelve (A—A11)U = 0 y se obtiene el vector propio 


1 
asociado Y, = | 1| . Para A2 = 25 — 50 1, se resuelve (A — A21)U = 0 y 
2 
1 3 
se obtiene el vector propio complejo asociado va = | 1| + | 0| 2. 


1) 2 
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Por consiguiente, estableciendo 


43 4 25 50 0 
P=|l1 0 1 y R=|(50 2 0 
52» 0 0 100 


se obtiene 
y [1-3 1] [25 -50 0 5 3 
ERP 1 0 1||50 25 0 FF SS 3 
52 2110 0 100] 9% ar 3 


1. 3 1| |-300  -50  -175 


==>, 1.0 1 275  -475 -100 
5 -2 -2| |-200 -1700 300 
1 725  -225 TÍO 29 9. -31 
=->=-|-500 -1750 125 | =|20 70  -5 


dad -1650 4100  -1275 66 -164 51 


En este ejemplo se ilustra la manera de expresar A como PRP7! cuando 


sus valores propios no son todos complejos. 


Ejercicios 2.3 


1. Exprese cada una de las matrices dadas como PRP7! 


1 2 Ll 1 3 
a d. C 
1-3 3 A “ll 1 
2-3 5 2 4 
a -b 
d. ¿ el 0 3l- Flan 3 
ba 
41 $13 


2. Suponga que Á es una matriz real de tamaño 3 x 3 tal que det A = 


50, tr, (4) = 8 y un valor propio es 2. Encuentre los valores propios. 
3. Sea A una matriz real de tamaño n x n y sea Y € C”, Muestre que 


Re(Ax) = ARe( 2) y Im(Az) = Alm(z). 
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2.4 Diagonalización de matrices simétricas 


Como se vio en la sección anterior, una matriz A de tamaño n x n puede 
tener valores propios complejos, aun en el caso de que todos los elementos 
de A sean reales. En este apartado se desarrollará la teoría de valores 
propios para matrices simétricas reales. 

Definición 2.11 Matrices congruentes ortogonalmente 


Dos matrices simétricas A y B de tamaño n x n son congruentes 


ortogonalmente si existe una matriz P ortogonal de tamaño nx n tal que 
A= P*BP. (2.24) 


Definición 2.12 Matrices semejantes ortogonalmente 

Una matriz simétrica A de tamaño n xn es semejante ortogonalmente 
a una matriz simétrica B de tamaño nxn si existe una matriz P ortogonal 
de tamaño n Xx n tal que 


A= P*BP. (2.25) 


Teorema 2.23 Dos matrices simétricas reales A y B son congruentes 


ortogonalmente si y solo sí A y B son semejantes ortogonalmente. 


Demostración. 
Si A y B son matrices simétricas congruentes de tamaño n x n, en- 
tonces 


B=PYAP, 


pero como P*P = [,,, se tiene que Pf = P7!. Por lo tanto, las matrices 
A y B son semejantes ortogonalmente. Ml 


Teorema 2.24 Sea A una matriz simétrica real de tamaño n x n, en- 


tonces los valores propios de A son reales. 
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Demostración. 
Sea Y E C” un vector propio asociado al valor propio A de A, entonces 


AU=»5. (2.26) 


Por el Teorema 2.21, se tiene que Y es también vector propio de A, pero 


asociado al valor propio A. 
Si se multiplica (2.26) por la izquierda por 7 ' se obtiene 


U Av= Ú AU = AU 7. (2.27) 
Luego, la conjugada de Y “A es 
Ar = 0 AT=0 A0=%, (2.28) 


donde hemos utilizado el Teorema 1.42. Por otra parte, como Á es real, 


se tiene que A = A. Por lo tanto, la ecuación (2.28) es igual a 


AY = 0'4G=(40) 57 = 5%, (2.29) 


aquí se utilizó el hecho de que 4? = A, ya que A es simétrica. 
Si se igualan (2.28) y (2.29), se tiene 


A0*7=A00'0, (2.30) 


pero 7 * y = |[úl1? 4 0, ya que U es un vector propio. Entonces se puede 


dividir ambos lados de (2.30) entre 0? 7 para obtener 
ÁA=A, 


lo cual se cumple solo si A es real. Mm 


Definición 2.13 Matriz diagonalizable ortogonalmente 
Una matriz A de tamaño n x n es diagonalizable ortogonalmente si 


existe una matriz ortogonal (Q) tal que 
QAQ =D (2.31) 


sea diagonal. 
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Teorema 2.25 Si A es una matriz simétrica real de tamaño n Xx n, en- 


tonces existe una matriz ortogonal Q tal que 


Q7AQ 
es una matriz diagonal. 
Demostración. 
Sean A1,A2,..., An los valores propios de A. Puesto que A: es real, 


existe un vector propio unitario 4; € R” de A correspondiente a Aj. 
Denotemos por V el complemento ortogonal a 41 de dimensión n— 1. Sea 
[ú2,U3,..., Un) una base ortonormal de V. Luego, cada vector X de V 
tiene la forma 


X =097 Ua +03 U3 +... + Ap Un, 


y el producto punto entre AX y U] es 
(A), = (140, = At y = XA) = Xu) = MX =0, 


puesto que cada vector de la base de V es ortogonal a 4. La matriz de 
cambio de base de la base canónica de R” a la base (U:, Uz,..., Uy es la 
matriz ortogonal S cuyas columnas son los elementos de los vectores u;. 
Luego 


AS = [Atíy Aa ... Aún) 
= [Ay ú1 AUa ... Aún], 
por lo tanto 
STAS=S" [MU Az ... Aún]. 


Pero como S es ortogonal, se tiene que 97! = S*, por consiguiente 


a a Sato > a 
SAS = [dí UD... Ún] [Ay Ala ... Aún] 
úMú úAda ... UL AUn 


Ad, UA, ... ULA, 


E Ao BA... ULA 


108 2. Vectores característicos y valores característicos 


Se puede probar fácilmente que S74AS es simétrica, ya que 
(SAS = (SAS "= SAS = 5 AS. 


Por consiguiente 


S 0 
Ss AS = S > 
0 
donde A: es simétrica de tamaño (n— 1) x (n— 1). 
La prueba se completa por inducción, si R* es una matriz ortogonal 


de tamaño (n—1) x (n— 1) tal que R*A¡(R*)7! = diag[A2, Az, ..., An). 
Entonces, la matriz 

1 O" vis 0 

0 


da LE] 


es una matriz ortogonal y 


RTASTASR=(SRIA(SR) = diaglAi, Mo, ---, An) 


La matriz SR = Q es el producto de dos matrices ortogonales, por lo 
tanto es también una matriz ortogonal. 

Así, Q714Q es una matriz diagonal y la prueba queda completa. Mm 
Teorema 2.26 Sea A una matriz simétrica real de tamaño n x n. En- 
tonces los vectores propios asociados con valores propios distintos de A 
son ortogonales. Esto es, los espacios propios de una matriz simétrica son 
ortogonales. 


Demostración. 
Sean 11 y U2 vectores propios que corresponden a valores propios dis- 
tintos, digamos A y A2. Para demostrar que U¡ - Y = 0, se calcula 


A1Ú1 - Ya = (A101)'v2 = (401)'0 puesto que 1%, es un vector propio 
= (0 A?) = 0 (Av») puesto que Á es simétrica 
= 01 (1202) puesto que Y, es un vector propio 


= Agiiia = Agúr - U. 
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Por lo tanto, (A1 — A2)51 : U2 = 0. Pero A1 — A2 4 0, así que 01-03 =0. Mm 


Teorema 2.27 Sea A, un valor propio de multiplicidad algebraica igual 
a p asociado a una matriz A simétrica real de tamaño n xn. Entonces A 
tiene exactamente p vectores propios mutuamente ortogonales asociados 
al valor propio Ax. 


Demostración. 

Por el Teorema 2.25, existe una matriz Q tal que Q7*4Q es una 
matriz diagonal en la cual A aparece exactamente p veces en la diagonal 
principal. Por otra parte, se tiene que Q7+4Q — Ag, = Q7! (A —- A O 
tiene rango n — p. Pero como Q y Q7! son no singulares, A — AgÍn 
también tiene rango n — p. Por lo tanto, el espacio solución del sistema 
de ecuaciones 


(A— AgIn)U = 0, con VER” 
tiene dimensión n — (n — p) = p y, por consiguiente, existen exactamente 
p vectores unitarios mutuamente ortogonales de IR”. Mm 
Teorema 2.28 Una matriz A simétrica real de tamaño n x n tiene n 
vectores propios unitarios mutuamente ortogonales. 


Demostración. 
Si D es la matriz diagonal Q* AQ, se tiene 


AQ=QD, (2.32) 


donde D = diagfA,...,Anj. Al igualar los vectores columna de cada 
miembro de (2.32), se obtiene 


Av =A1 Úl, A V= A Ua, O! Un = An Un, 
donde U¡, U2, ..., U, son los vectores columna de Q. Se deduce que las 
columnas de Q son vectores propios de A y que son vectores unitarios 
mutuamente ortogonales, por ser Q ortogonal. Mm 


Teorema 2.29 Sea A una matriz real de tamaño n x n. Entonces Á es 


diagonalizable ortogonalmente si y solo si A es simétrica. 
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Demostración. 

Sea A diagonalizable ortogonalmente, entonces por la Definición 2.13, 
existe una matriz ortogonal Q tal que Q*4Q = D. Si se multiplica esta 
ecuación por la izquierda por Q y por la derecha por Q* y se usa el hecho 


de que Q'Q = QQ! = 1,,, se obtiene 
A=0QDG*. 
Luego 
At =(QDQ"' =(Q0*'D'Q* =QDQ'=A. 


Así, A es simétrica. 

Recíprocamente, suponga que A es simétrica. Entonces por los Teo- 
remas 2.26 y 2.28, A es diagonalizable ortogonalmente con la matriz Q 
cuyas columnas son los vectores propios dados en el Teorema 2.28, y el 
teorema queda demostrado. Mi 


Procedimiento para encontrar una matriz diagonalizante Q 


i) Encuentre una base para cada espacio propio de A. 


ii) Halle una base ortonormal para cada espacio propio de A usando 
el proceso de Gram-Schmidt o algún otro. 


iii) Obtenga Q como la matriz cuyas columnas son los vectores pro- 
pios ortonormales obtenidos en el paso ii). 


Ejemplo 2.18 Encuentre una matriz Q que diagonalice ortogonalmente 


a la siguiente matriz: 


Solución. 
En este caso, los valores propios de A son A¡ = 1 (de multiplicidad 
algebraica 2) y A2 = 7. Los vectores propios linealmente independientes 
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1 2 
correspondientes a A1 = l son Uv = |0| y va = |-1|, y el correspon- 
1 0 
1 
diente a A2 =7 es Y3 = |2 
1 
Para encontrar (), se aplica el proceso de Gram-Schmidt a (01,2) 
-1/y2 
una base para B¡. Como ||0,|| = V2, se hace ú, = = 0 


Ta 


Después, 


2] 27 [1/v2 
50 E)-a3z 


1/43 

Entonces, [0%] = V3 y ds = |-1/V3| . Se puede verificar que la nueva 
1/43 

base de B¡ es ortonormal observando que u;1 - ua = 0. Por último, se tiene 
1/46 

que ||03]| = V6, luego uz = 2 . También se verifica que la base 
1/V6 

obtenida para R* es ortonormal, observando que ¡ - dz =0 y ús - uz =0. 

Por lo tanto, 


1/42 1/43 1/46 1/42 0  1/v2 
Q = 0  -1/V43 2/V6 |, Q' = | 1/43 -1/43 1/43 |, 
1/42 1/V3 1/v6 1/46 2/v6 1/v6 
y 
1/42 0  1/v2] [2 2 1] [-1/42 1/v3 1/v6 
Q'AQ = EN -1/V3 Mel E 5 ] | 0  -1/V3 ova 
1/46 2/v6 1/v6| |1 2 2] [1/42 1/v3 1/v6 


1/42 0 1/2] [-1/42 1/V3 7/v6 
= |1/V3 -1/V3 1/3 O  -1/V3 14/v6|. 
1/46 2/V6 1/V6| [1/42 1/V3 7/v6 
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a 


1.0 

QAQ=|O0 1 

0.0 

El siguiente teorema es un caso particular del Teorema 2.13. 


Teorema 2.30 Descomposición espectral de matrices simétricas 


Sea A una matriz simétrica real de tamaño n x nm con valores propios 
A1,A2,..., An, entonces A se puede escribir como 


Aa y ME(A), (2.33) 


i=1 


donde las matrices de proyección espectral vienen dadas por 


> E > > 
uu; UU; > 
EA) => == = 0,0%, (2.34) 
(U;, Us) UU 
con Ul,Uz,..., Un los vectores propios normalizados de A. 


Demostración. 
Por el Teorema 2.25, existe una matriz Q tal que Q7*4Q es una 
matriz diagonal. Entonces, 


A = QDQ* =QDQ' 

A 0 07 [a 
O de oli 

= [1 0 Dr) E .3 
00 Ml 1%, 
AjUt 
Au 

= [0 U Un] l 


lo cual prueba el teorema. Ml 
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Ejemplo 2.19 /lustrar el teorema de descomposición espectral para la 


matriz dada en el Ejemplo 2.18. 


Solución. 

Del Ejemplo 2.18, se tiene que los valores propios asociados a la matriz 
Ason A1 =7, A2 = Az = 1 y los respectivos vectores propios normalizados 
de A eran 


Í 1.21 
E(A) =40% =27/2| [1 2 1] =5|2 4 2 
1 124 
1 1-1 1 
E») =%%=>x|1|[1 1 1]=53|1 1 1 
1 1 -1 1 
1 ¿Lo 001 
E(A3) =%% => | 0| [1 0 As 04 0 
-1 1.0 1 
Nótese que E(A) + E(22) + E(A3) =lÍ3 y 
3 12 12 6 
Y O ME(4)=2|12 30 12], 
¿i=1 6 12 12 


la cual coincide con la matriz A dada en el Ejemplo 2.18. 


Teorema 2.31 Teorema espectral para matrices simétricas 
Sea A una matriz simétrica real de tamaño n x n, entonces las si- 


guientes afirmaciones son equivalentes: 


1) A tiene m valores propios reales, contando multiplicidades. 
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11) SiA es un valor propio de A con multiplicidad algebraica k, entonces 


el espacio propio para A es k-dimensional. 


111) Los vectores propios correspondientes a valores propios distintos son 
ortogonales, es decir los espacios propios son mutuamente ortogo- 


nales. 


iw) A es diagonalizable ortogonalmente. 


Demostración. 
Queda como ejercicio para el lector. M 


Ejercicios 2.4 


1. Determine si las matrices dadas a continuación son diagonalizables 


ortogonalmente: 
1 1 1.3 1 -1 
a b. Cc 
13 3 A 1 
12 2 3-1 4 
d.[2 1 2 el 1-5 


bado lisa 


2. Si las matrices A y B son ortogonalmente semejantes y B es ot- 
togonalmente semejante a una matriz C', muestre que A y C' son 


también ortogonalmente semejantes. 


3. Sea A una matriz ortogonal de tamaño n x n, muestre que si A es 


un valor propio de A, entonces |A| = 1. 
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4. Muestre que si A es ortogonal de tamaño nx n y Y y y son vectores 


en R”, entonces (AX) - (Ay) = 7 - y. 


2.5 Vectores propios generalizados 


En las secciones anteriores hemos considerado matrices en las cuales la 
multiplicidad algebraica de cada valor propio es igual a su multiplicidad 
geométrica. En este apartado consideraremos matrices que violan esta 
condición, es decir que la multiplicidad algebraica de cada valor propio es 
diferente de su multiplicidad geométrica y se obtendrá un nuevo concepto 
de vector propio asociado a la matriz. 
Definición 2.14 Vector propio generalizado 

Sea A una matriz real de tamaño n x n con un valor propio A; cuya 


multiplicidad algebraica es diferente de su multiplicidad geométrica. Un 


vector Y € C” se llama vector propio generalizado de A si cumple que 
k> > 
(A— AI.) 'U=0 (2.35) 


para algún k entero positivo. El mínimo entero k para el cual (2.35) se 


satisface recibe el nombre de índice del vector propio generalizado U. 


Nota 2.3 Los vectores propios de A son vectores propios generalizados 


de índice igual a 1. 
Ejemplo 2.20 Verifique si el vector vt = (2, 0) es un vector propio 
generalizado asociado al valor propio A=-5 de la siguiente matriz: 


-12 7 


JT. 2 
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Solución. 
Veamos que Y cumple (2.35) para algún valor entero k. Para k= 1, 


acom [77 10- 


Obsérvese que ví es el vector propio correspondiente a A. Para k = 2, se 
tiene que 


Luego, UY es un vector propio generalizado de índice k = 2. 


Definición 2.15 Espacio propio generalizado 


Sea Aj un valor propio de la matriz real A € Mnn. El subespacio 
Y, =[0 EC”: (4A— Dti = 0, para cierto entero positivo k) (2.36) 


se denomina espacio propio generalizado de A asociado con el valor propio 


Aj. En otras palabras, V; = kerf (A —- yn). 


Teorema 2.32 Sea A una matriz real de tamaño 2 x 2 con un único 
valor propio real A de multiplicidad algebraica distinta de la multiplicidad 
geométrica. Entonces existe un vector propio generalizado 3 que satisface 
la ecuación: 


(A—- ADu = 05, (2.37) 
donde Y es un vector propio correspondiente a A. 


Demostración. 
Sea Y € C? un vector fijo tal que Y 4 Qw. Luego, no es un vector 

propio de A. Sea 
y=(A-ADz. (2.38) 
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Demostremos que y es un vector propio de A; en otras palabras, que 
y = 87. Como 1 y í son linealmente independientes y y € C?, entonces 
existen constantes c1 y Ca tales que 


y=c1U+ca E. (2.39) 
Se debe mostrar que cz = 0. Si se reemplaza (2.38) en (2.39), se tiene que 


(A-ADi=C1 U+C) Y 
[A— (A+ c9)1]7=c1 0. 


Si se supone que cz % 0, entonces Á + cz no es un valor propio de A (el 
único valor propio asociado a A es A). Por lo tanto, 


det[A—(A+c2)1] 40. 
Sea B= A— (A+cz)Í, entonces B es no singular. Así, Y es igual a 
¿=Btaqi=aB”? 0. (2.40) 
Al multiplicar a ambos lados de (2.40) por A, se obtiene 
AB=AB"c 0=c0 B?(10)=c B? (AD. 
Pero A= B+(A+c>2)1, de manera que 


Ai =ca BB B+(A+ cal] 5 
=0c1 [1+(A+c2)B"3 y 
c1 U+(A+c2) [01 B7? 3] 


=Cc1 U+(A+cz) É, 


la cual se obtiene usando el hecho de que Z= c, B7! 5. Por lo tanto, 


=G UFAZAC E 


> 


= (1 U+Ca í. 


Pero como Y % QU, se debe tener que c1 = ca = 0, lo cual contradice la 
suposición de que cz % 0. Luego, c2 = 0 y sustituyendo en (2.39), se tiene 
que y = CiU. 

Ahora, se debe comprobar que c; % 0, en otras palabras se debe 
mostrar que y 0; pues si y = 0, al reemplazar en (2.38) se tendría 
que Y es un vector propio de A, lo cual contradice la suposición de que 
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1% QU. Luego, c; 4 0, es decir y es un múltiplo no nulo de Y y por el 


Teorema 2.1, es un vector propio de A. 
Por último definamos w = nd entonces 


1 1 
(A-AD)w6 = —(A-ADi= —Y =0. 

C1 Cl 
Esto prueba el teorema. Ml 
Ejemplo 2.21 Sea A = |. Determine sus vectores propios gene- 

1 2 

ralizados. 
Solución. 


La ecuación característica de A es 
E A 


Luego, A = 3 es el único valor propio (de multiplicidad algebraica 2), 
entonces 


(a-ano=(a-ano= |; 3] 2 =[o]. 
Esto conduce a que 11 = 12. Estableciendo x9 = 1, se obtiene solo un 
a . Luego, para encontrar 
un vector propio generalizado 12, se calcula (A — 31)U2 = U1 y se obtiene 


all = ll: 


La solución general corresponde a 11 — za = 1, luego 21 = 1 + zx. Por lo 


vector propio linealmente independiente: Y = 


; : En 1 
tanto si 19 = 0, se tiene Va = A ; 


Ejemplo 2.22 Encuentre los vectores propios generalizados de la matriz 
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Solución. 
La ecuación característica de A es 


3461 -124+8=-(A-2)?=0. 


Luego, A = 2 es el único valor propio (de multiplicidad algebraica 3), 


entonces 
1 1 1 E 0 
(A- ABU = (A-2)ú= 2 -1 -1 yl = 0 
3.2.2 Z 0 


Por lo tanto, el vector propio correspondiente se obtiene operando por 


filas 


E E 1110 100]|0 
211] 0,2 [011] 0| - [011]0 
3.022|0%R+mR|111J|0|R-=2|000]|0 


Esto conduce a que z = 0 y y = —z. Estableciendo z = —1, se obtiene 


0 
0 
el vector propio: Uv, = | 1| . Luego, para encontrar un vector propio 
=1 
a (A 


generalizado Va, se calcul — 21)U2 = Ú1 y se tiene que 
1.1 1|j 0 
2 1 A|ly| =|1|, 
3 2 2||z -1 


y si se realizan operaciones por filas se obtiene 


1.11] 0 -111]0 1.00] 
E AE A EEE 
3.022|1|Ri8|111]|02R|000]|0 
Es decir,  = l y y = 1-—z. Si se hace z = 0, se obtiene el vector 
1 
propio generalizado: Va = |1| . Para encontrar el segundo vector propio 
0 
generalizado 43, se calcula 
(A-—21)03 = Usa 
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Al resolver el sistema por Gauss-Jordan, se tiene que 


A dia E 100]|2 
¿ad dales lo 1idisl *.. losii3 
3 2 ae la ti 10. 1900010 


Luego, 1 =2 y y=3 — z. Si z =0, se obtiene el vector propio generali- 
zado: 


Solución. 
La ecuación característica de B es 


M4 62 121+8=0. 


Luego, A = 2 es el único valor propio (de multiplicidad algebraica tres), 
entonces 


0 
(B-AD)3=(B-2D)5=|1 11 4| [z2| =]0 
1 -25 -10] |23 0 


El vector propio correspondiente se obtiene operando por filas 


1.18 7 |0 -1 18 7 0 3.50]0 
1.14 4 Jo] + |0 7 3 [0| _-_ [07 3 ]|0 
1 25 -10 J0O| Z+H5 | 0 -7 -3 |0l3*+7R, | 0 0 0 J0 


Esto conduce a que x = 3y yz= Y. Estableciendo y = 3, se obtiene el 
5 


vector propio: Y = | 3| . Para encontrar un vector propio generalizado 


7 
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va, se calcula (B — 21)U2 = Ú, y se tiene que 


1118 7]|]|z 5 
1. 11. 4|ly| =]|3 
1 -25 -10| |z -7 
Si se realizan operaciones por filas, se obtiene 
1118 7 ]5 1118 7 15 3.507]1 
1.11 4 ]|3 a 07 3 |2 e PT 312 
1 25 10 |-7|*%+H5 | 0 -7 -3 |-2] 3.i+% | 0 0 0 JO 
Es decir, x = -1 + 2y YE A — 24. Si se hace y = 0, se obtiene 
1 
el vector propio generalizado: Ya = JA Para encontrar el segundo 
2 
vector propio generalizado U3, se calcula (B — 21)ú3 = U2, es decir 
1 18 7] [z 5 
1 11 4|ly| =]|0 
1 -25 -10] [2 3 
Al resolver el sistema por Gauss-Jordan, se tiene que 
1.118 7 | 1. 18 7 E 3.501 
1 11 4 jJ0| = Jo 7 -3 |Í o 0.7 3 | 
a | FF ? F3— Fa 
1 25 10 [3/ S+5 |0 -77 3 [3/72 |0 0 0 [0 
Luego, x = 5 + 3y y z2= -) - y. Tomando y = 0, se obtiene el vector 


Teorema 2.33 Sea U 4 Ú un vector propio generalizado con índice k de 


una matriz real A de tamaño n x n. Entonces, 
Lo, (A— AjIn)0,..., (A Ajln)*7*0) (2.41) 


es un conjunto de vectores linealmente independientes. 
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Demostración. 

Supongamos que y € C” es un vector propio generalizado de índice k 
y que los vectores dados en (2.41) son linealmente dependientes, entonces 
existen constantes Cy + 0 tales que 


y Cm Aj U = O, con Aj =A= Adm (2.42) 


donde A) = In. Sea fy(t) =c0 +c1t+...+ cert” un polinomio! diferente 
de cero de grado r < k— 1. Luego, la combinación lineal dada en (2.42) 
se puede expresar de la siguiente manera: 


f-(4,)v =0. 


Sea g(t) = t*, luego g(A;)U = ( por ser Y vector propio generalizado de 
índice k. Si existe un polinomio h(t) = t% con d < k que sea el máximo 
común divisor de f,(t) y g(t), usando el algoritmo de Euclides, h(t) se 
puede escribir como 


h(t) = ha(t) f,(t) + holt)g(t), 


donde h,(t) y ha(t) son polinomios, y así h(As) S hi (As) fr (Ay) + 
ho (Aj)I(A;). Por lo tanto, 


n(4;)5 =0. 


Luego, d sería el índice de Y, lo cual contradice la hipótesis de que k es 
el índice de Y y se concluye la prueba. Mm 


Teorema 2.34 Los vectores no nulos tomados de espacios propios gene- 


ralizados distintos son linealmente independientes. 


Demostración. 
Sea Ay = A—Ajla y Vi = ker[ AS) para algún entero k;, j = 1,2, 
...,P. Sean U1,..., Uy, con Y € V;, y supongamos que 


Tr 
y =>» 0, =0. (2.43) 


1 Si el lector desconoce este concepto, puede ver Lang (2004, cap. 11). 
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Se debe mostrar que cada Y; = 0. Si se multiplican ambos lados de (2.43) 
por la matriz O = AR? AÑ . . . AFr y se utilizan los hechos de que Aj Yi = 0 


y que aña = Ar AR, lo cual se tiene ya que 


A¡Aj =(A—Aifn) (A—Ajln) = 4 —MA— AGA + AA 
= A? — AA MAH AA LA = (A— Aylin) (A— Mila) = Aj As, 
se obtiene que 
dí = Ci =0. (2.44) 


Por lo tanto, vv = 0. De manera análoga, todos los Y; restantes tienen 
que desaparecer. MM 


De acuerdo con la Definición 2.8, las matrices reales cuadradas A y 
B se dicen que son semejantes si existe una matriz P no singular tal que 


A=PBP”_. 


En ocasiones, además de establecer el hecho en sí de la semejanza, se 
requiere encontrar la matriz P de la transformación que satisface que A = 
PBP”!. En estos momentos, se puede construir la matriz P utilizando 
los vectores propios generalizados de la siguiente manera 


P=SR”, (2.45) 


donde las columnas de la matriz S son los vectores propios generalizados 
de la matriz A y las columnas de la matriz R son los vectores propios 
generalizados de la matriz B. 


Ejemplo 2.24 Determine si las matrices dadas en los Ejemplos 2.22 


y 2.23 son semejantes. 


Solución. 

Como las dos matrices tienen el mismo polinomio característico, en- 
tonces son semejantes. Encontremos la matriz P. En el Ejemplo 2.22, se 
obtuvieron los siguientes vectores propios generalizados para la matriz A 


> 


2 
Uy = dl, v=|l y v <= 3 
0 
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Del Ejemplo 2.23 se tiene que los vectores propios generalizados de la 
matriz B son 


i 5 a A 2 
1=|3], E y Y%=¿]|0 
-7 2 -1 
Por lo tanto, 
cias Ta a o 2-0 
P=|1 1 3||3 0 0| =|1 1 3||-3 Z % 
1.0.0] [7 3 - 1.0 0J|[2 1 -1 
138 17 _2 
y 3 e 
— |_19 
sl? 0: 
o 0 


El lector puede verificar que A= PBP”!. 


Teorema 2.35 Todo vector en R” es una combinación lineal de vectores 


de los espacios propios generalizados V;. 


Demostración. 

Supóngase que V es el subespacio de IR” formado por los vectores de 
la forma u1 +... + Uy, donde u¿ € V;. Se necesita probar que V = R”. 
Supongamos que V es un subespacio adecuado. Entonces, se escoge una 
base (01 +... +05) de V y se extiende este conjunto a una base B de 
[R”. En esta base la matriz [4]y está particionada como sigue: 


An A 
Ala [3 42), 


donde A32 es una matriz de tamaño (n— s) x (n— ss). Los valores propios 
de Ax22 son valores propios de A. Como todos los valores propios distintos 
y vectores propios de A son considerados en V (es decir, en 411), se tiene 
una contradicción. Por tanto, V = R”, como se quería demostrar. MM 


Teorema 2.36 Sea Y; una base para el espacio propio generalizado V; 


y sea Y la unión de los conjuntos D;. Entonces, Y es una base para IR”. 
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Demostración. 

Vamos a probar que los vectores en Y generan ¡R”. Por el Teorema 2.35 
se tiene que todo vector en IR” es una combinación lineal de vectores en 
V;, pero cada vector en Y; es una combinación lineal de vectores en Dj. 
Por lo tanto, los vectores en Y generan |R”. 

Ahora, demostremos que los vectores en Y son linealmente indepen- 
dientes. Supongamos que una combinación lineal de vectores en Y suma 


> 


0. Es posible escribir esta suma como 
+... +0 =0, 


donde %; es la combinación lineal de vectores en YD;. El Teorema 2.34 
indica que cada 4; = 0. Como Y; es una base para V;, se deduce que los 
coeficientes de las combinaciones lineales Y, deben ser todos cero. Por lo 
tanto, los vectores en Y son linealmente independientes. 

Por el Teorema 1.27, se deduce que Y es una base de R”. mm 


Ejercicios 2.5 


1. Encuentre la matriz P que satisface que A = PBP”! para 


3.1 a] 42 130 25| 
A 9-d y B=|38 24 5 
22 0 ri A E 


2. Determine los vectores propios generalizados para las matrices 


-12 7 ; -10 —7 4 -1 
1 2 7 4 1 2 


Capítulo 3 


Descomposición de matrices 


Una factorización de una matriz Á es una ecuación que expresa a A como 
un producto de dos o más matrices. Por ejemplo, la descomposición de 
Sylvester y los teoremas de diagonalización dados en 2.19 y 2.25 son al- 
gunos casos de descomposición de una matriz. Estas descomposiciones son 
de interés especial cuando algunos de los factores son matrices ortogona- 
les; la razón es que las transformaciones ortogonales preservan normas y 
ángulos. Infortunadamente, como sabemos, no todas las matrices pueden 
ser factorizadas como A = PDP”! con D diagonal. Sin embargo, para 
cualquier matriz A es posible obtener una de las factorizaciones que se 
presentan en este capítulo, las cuales son importantes desde el punto de 
vista teórico, práctico y numérico. 


3.1 Triangularización de una matriz 


En esta sección nos centraremos en el estudio de diversas factorizaciones 
de una matriz A como producto de matrices triangulares. 


Teorema 3.1 Sea A una matriz real de tamaño m x n, entonces existe 


una matriz L triangular inferior no singular de tamaño m x m tal que 


A=5S, (3.1) 
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donde S es la matriz escalonada de A de tamaño m x n, obtenida sin 


intercambio de filas. 


Demostración. 


Sea A = [ax], empecemos con la primera fila no nula de A. Suponga- 
mos, sin pérdida de generalidad, que la primera fila de A es no nula. Sea 
a1; el primer elemento no nulo en la primera fila. Tomemos cualquier as; 
con 2 < 1 < m; si aj; = 0, no se hace nada; si aj¿ 4 0, se multiplica la 
primera fila por —a¡¿/a1j y se suma a la ¡-ésima fila. Esta operación hace 
los elementos (+, j) cero. Dicha operación es equivalente a premultiplicar a 
A por la matriz elemental E;1 (—asj/a15), la cual es una matriz triangular 
inferior. Así, hemos usado el elemento (1, j), es decir a17, como un pivote 
para eliminar todos los otros elementos de la j-ésima columna. La matriz 
resultante o matriz reducida es obtenida matemáticamente premultipli- 
cando a A sucesivamente por un número finito de matrices triangulares 
inferiores cuyo producto es también una matriz triangular inferior. Ahora 
continuemos con la matriz reducida, tomemos la segunda fila. Si todos sus 
elementos son iguales a cero, se pasa a la tercera fila. Si no se encuentra 
cualquier vector fila no nulo entre la segunda, tercera, ...,m-ésima fila, el 
proceso termina. La matriz reducida es claramente una forma escalonada. 
En otro caso, localice el primer vector no nulo entre las m — 1 filas de la 
matriz reducida empezando desde la segunda. Repita el proceso de elimi- 
nar todas las entradas debajo del primer elemento no nulo (pivote) del 
vector escogido no nulo. Repita este proceso hasta que no pueda encon- 
trar ningún otro vector no nulo en la matriz reducida. La matriz reducida 
es claramente una forma escalonada. La matriz S es simplemente el pro- 
ducto de todas las matrices triangulares inferiores empleadas durante el 
proceso. Claramente, S es una matriz triangular inferior no singular. Esto 
completa la prueba. MM 


Definición 3.1 Descomposición LS 
Una factorización como la indicada en (3.1), es decir, como el produc- 
to de una matriz no singular triangular inferior L y una forma escalonada 


S, si existe, se llama descomposición LS de la matriz A. 
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Ejemplo 3.1 Hallar una factorización LS de la matriz: 
24250 
AS |1 11 
23 4 4 


Solución. 
Se procede en dos columnas como sigue: 


Reducción de Aa S Creación de L a partir de / 
2420 1050 
A=|1 1 3 1 I=|0 10 
234 4 0.01 


Dividir la fila 1 por 2 


12-150 2 0 
=|1 1-3 1 =|0 1 
2 -4 4 0 1 


Sumar la fila 1 multiplicada 
por —1 a la fila 2 


12-150 0 
A 1 2 1 =|1 1 
2.3 4 4 1 


Sumar la fila 1 multiplicada 
por —2 a la fila 3 


12-150 0 
a 1 2 1 =[|1 1 
0-1 2 4 l 


Multiplicar la fila 2 por —1 


1:38 d 0 0-0 
e pl [1 A 
0 1.24 O 1 


Sumar una vez la fila 2 
a la ¿ 


1-20 L 0 2.0.0 
=|01 2-1 =|1 1.0 
0.0.0 3 2 -1 1 
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Dividir la fila 3 por 3 


12-10 2.0.0 
=|012-1|=S8 =|1-1.0]|=L£. 
00 0 1 2-1 3 


El lector puede verificar que A = LS. 


Teorema 3.2 Sea A una matriz real de tamaño m x n cuya forma es- 
calonada puede hallarse sin intercambio de filas. Entonces, A tiene una 
única factorización LS si y solo si p(A) =m. 


Demostración. 
Supongamos que p(A) =m y que A= LS y A= MV, siendo L y M 
matrices triangulares inferiores y S y V matrices en forma escalonada. 
Multiplicando por la izquierda, la igualdad 


LS = MV 
por M”!, se obtiene que 
MLS =V,. (3.2) 
Sea N = M7LL. Si se logra probar que N = 1, se tendrá que L = M y 
sustituyendo en (3.2), se obtendrá S = V. 
Se procede por inducción sobre m. Si m = 1, entonces 
A= [0 sz Misal ces 41m] , 


y la única factorización posible es 


A= [a1,+1) [0 A el 


d1jr+1 


Supongamos que el resultado es cierto para matrices con m— 1 filas. Si la 
primera columna 51 de S fuera nula, la primera columna %, de V también 
lo sería, ya que 


,=N3,=N0=0 


y, recíprocamente, por ser NV no singular. Se puede por lo tanto suponer, 
sin pérdida de generalidad, que las primeras columnas de S y V son no 
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nulas. Entonces la primera columna tiene un uno principal en la primera 
fila. 

Nótese, además, que N es triangular inferior por ser producto de 
matrices triangulares inferiores. Si se reescribe el producto NS = V par- 
ticionando N en submatrices [1+(m-—1)] x [1+(m-— 1)] y las matrices 
S y V en submatrices [1 + (m — 1)] x [1+ (n— 1)], se tiene que 


a 10) 1 S12 1 Via 
NS = = A 
| Na Na | | O Sa | | O Va | 
de donde 


a =1, aS12 = Via, 
Na =0, Na2892 = Vaz. 


Ahora bien, Na2 es una submatriz real de tamaño (m— 1) x (m—1) que 
es triangular inferior y no singular, S29 y Va2 son submatrices en forma 
escalonada. Por la hipótesis de inducción, 


Na = Im-1, 


y por lo tanto 


1 0 
Moe 


Si se supone que r = p(A4) < m, aplicando el algoritmo se obtiene la 


(bu S11 
alía tas JLo) 


Pero es obvio que si Loa es una submatriz triangular inferior no singular 


factorización 


de tamaño (m E r) x (m o r) cualquiera, también se puede escribir 
au 0 [Sn 
La Loa ||0]? 
y la factorización no es única. Ml 
Corolario 3.2.1 Sea A una matriz no singular de tamaño nxn cuya for- 


ma escalonada puede hallarse sin intercambio de filas. Entonces A tiene 


una única factorización LS. 
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Demostración. 

Supongamos que A = L151 y A = L253 son dos de dichas factorizacio- 
nes. Nótese que tanto > como L, ! también son triangulares inferiores 
y Si Ls So l son triangulares superiores, que además tienen unos en la 
diagonal principal por ser A no singular. 

Ahora bien, de L151 = L253 se obtiene que 


Ls Ly =038 


Es claro que Ly LL es triangular inferior por ser producto de triangulares 
inferiores y que S203 l es triangular superior por ser producto de trian- 
gulares superiores. Como son iguales, se concluye que el producto debe 
ser diagonal. Además, Sa y 9; l tienen unos en la diagonal principal y, 


por lo tanto, 9257 l también tiene unos en la diagonal principal. 
En definitiva ES “La = SS, ? = [,,, de donde se deduce la unicidad. 
] 


Teorema 3.3 Si no ocurren intercambios de filas durante la reducción 
de una matriz A de tamaño mx n a una matriz escalonada S, entonces 


A puede ser factorizada como 
A=LDU, (3.3) 


en donde L es triangular inferior de tamaño m x m, D es la matriz de 


pivotes de tamaño m x m y U es una matriz escalonada. 


Demostración. 
Sea 
S=EpEx-1... EE A 
la forma escalonada de A, donde E;, 1=1,2,...,k son matrices elemen- 


tales de tipo R¡ y Ra, puesto que no se han realizado intercambio de filas. 
Entonces resulta que 


A=E E Ea =D, 
Después de que se determina A = LS, se continúa factorizando S como 


S =DD"*S = DU, 
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en donde D es la matriz diagonal de pivotes cuyo elemento diagonal en 
la p-ésima fila es 1 si la p-ésima fila de S es O, y es a si a es el primer 
elemento no nulo de la p-ésima fila de S. La matriz escalonada U = D7!S. 
Entonces, se puede reescribir el producto A = LS como 


A=LDU= MU, 


en donde M = LD. Esto prueba el teorema. Ml 


Ejemplo 3.2 Hallar la factorización LDU de la matriz dada en el Ejem- 
plo 3.1. 


Solución. 
Del Ejemplo 3.1, se tiene que 


2.0.0 12-110 
A=|1 1.0 0.1 2 -1 
2-1. 3 00 0 1 


Los pivotes eran 2, —1 y 3. Luego, su factorización LDU es 


1007][2 007[1 2-10 
2 .10||p0-10|[|0 1 2 1 
11 1]||0 0 3||00 0 1 


Teorema 3.4 Factorización única 
Sea A una matriz no singular de tamaño n xn. Una factorización de 


la forma (3.3) está determinada de manera única si y solo si 
1. L=|[!,¡] es triangular inferior con l;; =1 para i=1,2,...,n, 
2. U = [us] es triangular superior con u¡; = 1 para i=1,2,...,n, 


3. D'= [d;5] es diagonal con dis % 0 para ¿+= 1,2,....N. 


Demostración. 

Supongamos que A = L¡D¡U;¡ y A = L2.D3U» son dos factorizaciones 
de A distintas. Nótese que tanto E como L, ! también son triangulares 
inferiores y U; z y U)z l son triangulares superiores, que además tienen 
unos en la diagonal principal por ser A no singular. 
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Ahora bien, de L1D1U¡ = L2D3U» se obtiene que 
UU * =D, *L,*L3Do. 


El lado izquierdo es un producto de dos matrices triangulares superiores 
con elementos en la diagonal principal iguales a uno. Dicho producto 
debe ser otra matriz del mismo tipo. Por otra parte, el lado derecho 
es una matriz triangular inferior. Esto obliga a que ambos lados sean 
precisamente la matriz identidad: la única matriz que al mismo tiempo 
es triangular superior con diagonal unitaria y también triangular superior. 
Así, Lu" = Í,,, y después de multiplicar por Uz se tiene que U¡ = Us. 
Análogamente, L¡ = La y, finalmente, D; = Do. MM 


Teorema 3.5 Si A es una matriz simétrica que se puede factorizar como 
A = LDU sin intercambios de filas que destruyan la simetría, entonces 
la triangular superior U es la transpuesta de la triangular inferior L. En 
otras palabras, toda matriz simétrica tiene una factorización simétrica de 
la forma A= LDL!. 


Demostración. 
Supongamos que A puede factorizarse como A = LDU; tomando la 
transpuesta, se tiene que 


AS (LDU"=0 "DL =U DE. 


Como A es simétrica, es igual a A?; así resulta que tenemos dos factori- 
zaciones de A en triangular inferior por diagonal por triangular superior. 
(L* es triangular superior con unos en la diagonal, exactamente como U”). 
De acuerdo con el Teorema 3.4, esta factorización es única; por lo tanto, 
L* debe ser idéntica a U, lo cual completa la prueba. Mm 


Ejemplo 3.3 Hallar una factorización LDU para la matriz: 
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Solución. 
Se procede en dos columnas como en el Ejemplo 3.1. 


Reducción de Aa S Creación de L a partir de / 
1.3.5 100 
A=|3 12 18 I=|0 10 
5 18 30 0.0 1 


Sumar la fila 1 multiplicada 
por —3 a la fila 2 


113.05 1050 
5 18 30 0.0 1 


Sumar la fila 1 multiplicada 
por —5 a la fila 3 


135 1050 
0.35 5.0 1 


Sumar la fila 2 multiplicada 
por —1 a la fila 3 


13.5 10.0 
e LE =|31.0]|=L. 
0.02 5 1 1 


Por tanto, se tiene que A = LS, y factorizando a S, se llega a 


13.5 10.0 13.5 
S=|033|=|0 3 0 0 1 1 
0.02 0.0 2 0.0 1 


Nótese que L* = U. 


Teorema 3.6 Descomposición triangular LU 
Sea A una matriz real de tamaño n x n tal que todos sus menores 


principales son no nulos. Entonces A puede ser factorizada como 
A=LU, (3.4) 


donde L es una matriz triangular inferior y U es una matriz no singular 


triangular superior, cada una de tamaño n X N. 
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Demostración. 
Queda como ejercicio para el lector. M 


Definición 3.2 Matriz triangularizable 
Una matriz A de tamaño nx n es triangularizable si existe una matriz 
no singular P tal que 


P-APp=T (3.5) 


es triangular. 


Teorema 3.7 Descomposición de Schur 
Si A es una matriz real de tamaño n x n con valores propios reales 


A1,A2,..., An, entonces existe una matriz ortogonal Q tal que 


Q'AQ =T = [tujl, (3.6) 


donde T' es una matriz triangular superior con elementos en la diagonal 
ti = Ai, 1 = 1,2,...,n. (Es decir: toda matriz cuadrada real con valo- 
res propios reales es ortogonalmente semejante a una matriz triangular 


superior). 


Demostración. 

La demostración es por inducción sobre n. Si n= 1, A es una matriz 
real de tamaño 1 x 1 que es triangular. La matriz ortogonal es Q = [1]. 

Supongamos que toda matriz real de tamaño (n—1) x (n—1) es trian- 
gularizable por una matriz ortogonal. Sea A una matriz real de tamaño 
n x n con valores propios reales. Sea U, € I¡R” un vector propio unitario 
asociado al valor propio A¡. Denotemos por W el complemento ortogonal 
a U1 de dimensión n— 1. Sea (0, UB... Un) una base ortonormal de W. 


Luego, cada vector X de W tiene la forma 


> 


X =49 UV +43 03 +... + Mp, Un. 
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La matriz de cambio de base de la base canónica de IR” a la base 
(0, Va)... , Dn) es la matriz S cuyas columnas son los elementos de los 
vectores 0. Luego, 


AS = [ Av Ava ... Aún ] 
= [ A101 AU ... AUn ¡A 
Por lo tanto, 
SAS =S"U|[ AU AV ... AU]. 


Pero como S es ortogonal, se tiene que 97! = S?, Por consiguiente 


Az L12 «+. Lln 


SAS = h 
. Ay ? 


Lo 
donde 21; = VÍ A0, y Aj es una matriz real de tamaño (n — 1) x (n— 1). 
La prueba se completa por inducción: sea R¡ una matriz ortogonal 


de tamaño (n — 1) x (n - 1) tal que (R1)4¡R, = TT, con T, triangular 
superior, por la hipótesis de inducción. Entonces, la matriz 


también es una matriz ortogonal y 


t a t t 1 0 A qe 1 0% 
(SRFA(SR) =R (S AS)R = | 0 Ri a y OR 
A1 Ri 
le 
donde 2% = [212 213 ... 21m]. La matriz SR = Q es el producto de 


dos matrices ortogonales, por lo tanto es también una matriz ortogonal. 
Así, Q'AQ es una matriz triangular superior y nuestra prueba queda 
completa. E 
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Ejemplo 3.4 Dada la matriz: 


0.1.0 
A= lia AN 
E 


Encuentre la triangularización de A. 


Solución. 
El polinomio característico de A es 


pA(A) = (2— AY. 


Entonces, el único valor propio es A = 2 (de multiplicidad algebraica 
0 
3). Los vectores propios correspondientes a A= 2 son 41 = | 0 | y 
1 
1 
uy = | 2 | . La idea básica del teorema de Schur consiste en construir 
0 
una base de R? con el mayor número posible de vectores propios. 
2 
Si tomamos por ejemplo uz = UU] Xx Ua = 1 |, el conjunto 
0 


[ú,, U2, uz) es una base de I¡R3. Mediante el algoritmo de Gram-Schmidt, 
obtenemos la base ortonormal (5, Va, U3), donde 


0 1 2 
0 1 ) 1 
1= » Uva = — y U3 = —= 


La matriz ortogonal Q es 


0 ¿v5 -5v5 
Q=| 0 ¿vV5 gv5 
1 0 0 


La matriz triangular es 


0 oO 1 0.10 0 145 -¿v5 
T=QUAQ = | ¿V5 ¿vV5 0||-4 4 0||0 5v5 ¿v5|, 
¿vV5 5v5 0] |-2 1 2 1 0 0 
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y al realizar las operaciones, se llega a 
2.0 1/5 


T=|0 2 5 
0.0 2 


Obsérvese que los elementos de la diagonal principal de la matriz T' son 
los valores propios de la matriz A. 


Definición 3.3 Triangularización simultánea 
Si P es una matriz no singular tal que P7+AP y P7|BP son ambas 


diagonales (triangulares), entonces se dice que A y B son diagonalizables 


(triangularizables) simultáneamente. 


Teorema 3.8 Si A y B son matrices de tamaño n xn y AB = BA, 
entonces A y B tienen un vector propio en común. 


Demostración. 

Sea Az un valor propio de A y sea Bj = (51, 02, 23 , Ur) una base 
del kerj A — Api de Entonces, cualquier combinación lineal no nula de 
By, constituye un vector propio correspondiente a Az y, recíprocamente, 
cualquier vector propio de A correspondiente a Az está en gen[ Bj). 

Si para algún j¡ =1,2,...,k, Bv; = O, entonces v; es un vector propio 
de B asociado al valor propio O y el teorema queda demostrado. Suponga 
que Bv; A O, entonces 


A(B0;,) = (BA)v; puesto que AB = BA, 

= B(A0;) puesto que Y; es un vector propio de A 

= Ax (Bu). 
Luego 

Bv; € gení B; ) para q =1L,2 0.0, k. 
Al expresar cada BY; como una combinación lineal de (01, 0, si Ue), 
se tiene 
k 
Bv; = Y 0% 3 A 


a=1 
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Este sistema de ecuaciones escrito en forma matricial queda 


C11 C12 +++ Clik 
e e _ C21 C22 ++. Cok 
B[ú 0 4] =[% d ... %] . a ] 
_—— pm _—— pr : : E, : 
Ck1  Ck2 Ckk | 
B V e V C 
donde C = [c;;] sea 11 un valor propio de Cy ú*=[0a1 ar... ax) el 


vector propio asociado a 11. Entonces 


(Bv)ú =(VC)]u 
= V (pú) puesto que y es un vector propio de C 
= pm (va). 


Luego, Vu es un vector propio de B, pero nótese que 


k 
Vu= y QU, € gen[ Bj», 
¿=1 


y por consiguiente Vu es un vector propio de A. Mm 


Ejemplo 3.5 Sean 


e | re 
A= 132 a 3 y B=li Ad 
A 0 ral 


Determine si AB = BA y encuentre un vector propio que sea común a 


las matrices A y B. 


Solución. 
Al realizar el producto entre A y B, se obtiene 


13 7 7 
AB = 23 8 5 |=BA. 
16 7 4 
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Para encontrar el vector propio común a A y B, primero se establece la 
ecuación característica de la matriz A, 


pa(A) = +32 -31+1=-(A-1)=0, 


luego A = 1 es el único valor propio con multiplicidad algebraica igual a 
tres. Entonces, 


1 1 -1 zx 0 
(4A-AD)u=(4-Dv=| 2 2 2 yi=1|0 
A 1 1 Z 0 
Esto conduce a x — y = z. Luego, los vectores propios linealmente inde- 
1 0 
pendientes son Y, = | 0 | y v= 1 
1 1 
Ahora, se calcula 
6 0 
Bu = 18 y Bv =|-3 
-12 3 


Al expresar Bv, como una combinación lineal de (1,2), se tiene 


1.0 
V=j|0 1 y Pelo le 
1 -1 


Nótese que BV = VC. Por otra parte, los valores propios de C son 1 =6 
y ua = —3, y los vectores propios correspondientes son uf = [1 2] y ul = 
[0 1], respectivamente. Entonces, Vú, = [1 2 -1]' y Vús = [0 1 -1] 
son vectores propios comunes a las matrices A y B. 

Teorema 3.9 Si A y B son matrices de tamaño n xn y AB = BA, 
entonces A y B pueden ser triangularizadas ortogonalmente en forma 


simultánea. 


Demostración. 
La demostración es por inducción sobre n. Por el Teorema 3.8, existe 
v € R” normalizado tal que 


AV = A1U1 y Bv; = 11101. 
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De manera análoga, como en la demostración del Teorema 3.7 se cons- 
truye una matriz S ortogonal cuya primera columna sea 1], entonces 


Al. DiZ + Via pi Y12 -.- Yin 
0 0) 


t _ t == 
SAS =|. pa y SBS =|. 5 
0 0 


donde A, y B¡ son matrices reales de tamaño (n — 1) Xx (n - IA Por otra 
parte, 


(S*AS) (S*BS) =F(AB)S puesto que Sí = 971, 
= S(BA)S puesto que AB = BA, 
= (S'BS) (SAS), 


y por la multiplicación por bloques, se tiene 


Loco am | loc: mua | 


donde 7 *= [212 213 ... Lin], 4 *=Íy12 Yiz -... Yin], y por lo tanto 
A¡B¡ = B,4¡. Los detalles para culminar la prueba son análogos a los 
del Teorema 3.7 y se dejan como ejercicio para el lector. Mm 


Teorema 3.10 Si A y B son matrices simétricas de tamaños n X N, 
entonces AB= BA si y solo si existe una matriz ortogonal Q de tamaño 


n xn tal que Q'AQ y Q'BQO sean ambas diagonales. 


Demostración. 

Supongamos que AB = BA. Por el Teorema 3.9, existe una matriz 
ortogonal Q tal que Q*AQ y Q* BQ son ambas triangulares. Pero como 4 
y B son simétricas, pueden ser diagonalizables ortogonalmente. De aquí 
que Q*AQ y Q'BQ sean diagonales. Por otra parte, si QAQ = Da y 
Q*BQ = Dg son ambas diagonales, entonces 


AB = (QDAQ)(QDBQ%) = QDADEQ* 
= QDBDAQ' = (QDBQ) (QDAQ”) 
BA: 


Esto completa la demostración. Ml 
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3.2 Factorización QR 


Esta factorización se usa ampliamente en los programas de computadora 
para resolver sistemas lineales, para determinar aproximaciones por mí- 
nimos cuadrados y para determinar los valores propios de una matriz. 


Teorema 3.11 Factorización QR 
Sea A una matriz real de tamaño m x n con p(A) = n. Entonces 
existen una matriz Q de tamaño mx mn cuyas columnas son ortonormales 


y una matriz no singular R de tamaño n x n triangular superior tales que 


A=QR. (3.7) 


Demostración. 

Como p(A) = n, entonces sus columnas son linealmente independien- 
tes. Sean ¡EA Day. del las columnas de A, las cuales constituyen una 
base para el espacio generado por las columnas de A [Col(A)] y mediante 
el proceso de Gram-Schmidt, se ortonormalizan estos vectores para ob- 
tener (5, Va)... ¿Un una base ortonormal para el espacio generado por 
las columnas de 4. Sea 


Q=l| a Da... Der Ju 
Al expresar cada 2; como una combinación lineal de (11, U2,..., Un), se 
tiene 
n 
Lj = > PijUi, JE 1,2, ¿AN 


T11 7192 <<. tn 
> > > > > —> 21 722 ES T2n 
E 1 da | = [4 Y2 | . 
———__ ——__ 
ni Tn2 Pan 
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donde 
P1k 
== les do 
Tnk 
Por otra parte, como %; es ortogonal a la base gen[%,, Va)... ,D4) sij>k, 


entonces es ortogonal a 21. Por lo tanto, r;j = 0 para j > k, ya que 


>t > 


Tik = j Uk = ¡Tk 


Sea R=| Fi 2... Fn ), entonces 
ri T12 713 +... | 
0 Pa 72938 «<.. Pm 
A =QR=Q 0 0 733 +... T3n 
| 0 0 Do... hn] 


Ahora, mostremos que R es no singular. Consideremos el sistema lineal 
Rb= 0 y multipliquemos por Q a la izquierda, es decir 


QRÚE= Q0 
- _- 
A b= 0 


Pero como las columnas de A son linealmente independientes, el sistema 
homogéneo Ab = 0 solo tiene la solución trivial. Por lo tanto, R es no 
singular. MM 

Nota 3.1 Para el caso en que Á sea una matriz real de tamaño m x n 
con p(A) = m, entonces se puede encontrar una factorización de manera 


análoga a (3.7) de la forma 


A=L0: (3.8) 


donde L es una matriz real de tamaño m x m triangular inferior y no 
singular, y Q es una matriz real de tamaño mx n cuyas filas son ortonor- 


males. 
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Ejemplo 3.6 Encuentre una factorización QR de 


Solución. 
Denotemos las columnas de A por 


4 25 
L1 = 0 y Í9 = 0 
3 -25 


Si se aplica el algoritmo de Gram-Schmidt al conjunto (21,22) base 


para el espacio generado por las columnas de A, como ||, [| = 5, se hace 
a 4/5 
ca L1 
==. '"r= 0 . Después, 
[El 3/5 
25 4/5 
va = Ya — (La: U,)U1 = 0 o) 0 
-25 3/5 
25 4 21 
= 0 =|0|=-= 0 
-25 3 -28 
3/5 
Entonces, ||W) || = 35 y Us = 0 . Se puede verificar que (51, 2) es 
4/5 


una nueva base ortonormal para el espacio generado por las columnas de 
A, observando que Y; - Ya = 0. Entonces formamos la matriz 


O =..% ale! 


4 3 
=|0.0 
, 3 


-4 


Para encontrar R, se despeja esta matriz de A = QR, de la siguiente 
manera: 


Q'A=Q*(QR) =IR=R. 
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De esta manera, la matriz R es 
14 0 3 O 505 
A Y A La 
3 -25 
El lector puede verificar que A = QR. 
Si la matriz A es cuadrada, entonces se puede enunciar el Teorema 3.11 
de la siguiente manera. 


Teorema 3.12 Toda matriz cuadrada real A puede expresarse en la for- 


ma: 

A=QR, (3.9) 
donde (Y es una matriz ortogonal propia y R es triangular superior, con 
Ta >0,1=1,2,....n— l. 


Demostración. 
Queda como ejercicio para el lector. M 


Corolario 3.12.1 Si A es ortogonal con det A = 1 entonces, en (3.9), 


R= I,. Si det A= —1 entonces, los elementos de R = [r;¿] cumplen que 
los == 
Pij = 
0 si LA), 
excepto Tan = —1. 
Demostración. 


Si A = QR, entonces 


det A = det (QR) = det R, ya que detQ =1 
n—1 
= nn II 0) : 
¿=1 
Por tanto, se tiene que "nn = +l ya que det A = +1, y la prueba del 


corolario se completa. Ml 
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Corolario 3.12.2 Si A es no singular, entonces la representación dada 
n (3.9) es única. 
Demostración. 


Supongamos que Á es no singular y consideremos dos factorizaciones 
distintas 


A =QR y A=0QR, 


con Q y Q”, ambas ortogonales propias, y R y R' triangulares superiores. 
Entonces 


IT = OO'RR? — (010) (RR?) 
=QR. 
Aquí, la matriz ortogonal / está representada como el producto de una 
matriz ortogonal propia Q y una triangular superior R. Por lo tanto, de 


acuerdo con el Corolario 3.12.1, R=IyQ=1. Luego, =RyQ'=0Q 
de este modo el corolario está probado. Ml 


Ejercicios 3.1 
Para cada una de las siguientes matrices determine (en caso de ser 


posible) las factorizaciones LU y QR y la descomposición de Schur: 


LA td Ll 13 
1 2 3. 4 

L 3 | Al 8 4 3 
22 1| EN 4 | 31] E 3. 3 
(1:31 ¿3 E PO AS 8-13. 1 2 
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3.3 Polinomio mínimo 


El polinomio característico de una matriz es un instrumento para calcu- 
lar sus valores propios. En esta sección se estudia el polinomio mínimo 
de matrices, el cual resulta muy útil para establecer criterios sobre la 
posibilidad de reducir matrices a formas canónicas simples. 
Definición 3.4 Polinomios de matrices 

Si A es una matriz real de tamaño n x n, el polinomio p,(A) denota 


la matriz que se genera si se reemplaza cada aparición de x en p, (1) por 


la matriz A: 
A O 


donde a; ER (i=0,1,...,n) y AM = Is 


En consecuencia, se dice que A satisface el polinomio p, (1) si p,(A) = O. 


Ejemplo 3.7 Verifique si el polinomio pa(x) = x? — 3x — 28 lo satisface 


la matriz: 


Solución. 
Si la matriz A satisface dicho polinomio se debe verificar que 


PSA) =:A*=3A=981=0, 


Como 


31 -15 
2_ 
ij = | ls 


al sustituir, se tiene que 


ET E AE RAPE 
0323] [32)-(30) 


Luego, la matriz A sí satisface el polinomio dado. 
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Teorema 3.13 Teorema de Cayley-Hamilton 


Sean A una matriz de tamaño n xn y 
palA) =det(A= Ala) = "+6 AA 7 E ARA =0 


su polinomio característico. Entonces, palA) = O. Es decir, A satisface 


la ecuación 


Par a tae Ataa=0. 


El teorema es verdadero para cualquier matriz; sin embargo, la prueba que 
se presenta a continuación es únicamente para matrices diagonalizables. 
La demostración para el caso general puede verse en Apostol (1985, p. 
249). 


Demostración. 
Supongamos que A es diagonalizable. Como pa(A) es una ecuación 
escalar, al multiplicarla por cualquier vector Y € R”, se tiene 
pA([A)T =(A + co 1071... c1A+c09)0=0 


=D +10 +.. + 018 + cpd =0. 


Si UY es un vector propio correspondiente al valor propio A, se cumple 
DAÍA)T =A POH CA GAP 04 + O A0+ col 0d =0. (3.10) 


Esto se cumple para todos los vectores propios de A. Pero como A es 
diagonalizable, tiene n-vectores propios linealmente independientes, luego 
cualquier otro vector de IR” puede ser expresado como combinación lineal 
de estos. Por lo tanto, (3.10) se cumple para todo vector de R”. De aquí, 


Par AR e E AA Ac. =0, 


es decir que A satisface su propia ecuación característica. M 
Sea A una matriz real de tamaño n x n y definamos 


S = [pn(x)|pn(A) > O), n> 1. 


Entonces, en S se puede escoger un polinomio no nulo q(x) que tenga 
grado mínimo; además, se puede suponer que el coeficiente de q(x) co- 
rrespondiente al término de mayor grado es 1, es decir que q(1) es mónico. 
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Con estas condiciones, para q(x) se puede demostrar que cualquier otro 
polinomio p(x) de S es múltiplo de q(x). Esto implica que si en S existiera 
otro polinomio r(+) mónico del mismo grado de q(x), es decir de grado 
mínimo, entonces r(x) = q(x). 


Definición 3.5 El polinomio mínimo de una matriz A es el polinomio 


no nulo de menor grado que es satisfecho por A. Se denotará por ma([(x). 


Como la multiplicidad algebraica de los valores propios de una matriz es 
a veces distinta de uno, el polinomio característico pa(1) no es necesaria- 
mente el polinomio de grado mínimo satisfecho por A. 


Teorema 3.14 £l polinomio mínimo de una matriz cuadrada A es úni- 
co cuando se impone que el coeficiente del término de mayor exponente 


(grado) en la indeterminada sea igual a la unidad. 


Demostración. 

La prueba se realiza por contradicción. Supongamos que ma(x) y 
m/,(x) son polinomios mínimos de A; por la Definición 3.5, ambos tienen 
el mismo grado. 

Al considerarse los coeficientes dominantes respectivos iguales a la 
unidad, el polinomio d(x) =ma(x) — m,(x) tiene grado menor que los 
polinomios mínimos y se anula también para A, y necesariamente d(x) = 
0. Luego, ma(1) =mM4(x). E 


Teorema 3.15 Si A satisface un polinomio p,(x), entonces p(x) es di- 


visible por ma(x), polinomio mínimo de A. 


Demostración. 

Sea ma(x) el polinomio mínimo de A, el grado de p(x) es mayor 
que el de ma(x). Por el algoritmo de la división, sabemos que se pueden 
encontrar polinomios q(1) y r(x) tales que 


pnl) = malu)ale) + r(x), 


con grad|r(=)] < grad[ma(x)]. Entonces, r(x) = pní(x) — malo)a(z), 
y como pn(A) = O, ma(4) = O. Se tiene que r(4) = O. Luego 
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r(x) es el polinomio mínimo de A, lo cual contradice la hipótesis. Co- 
mo grad|r(x)] < grad[ma(u)], se debe tener que r(x) = 0. Por lo tanto, 
max) es un factor de pp(2). M 


Teorema 3.16 Si A y B son matrices semejantes y qn(1) es cualquier 


polinomio, entonces: 


dl(4)= Pa (BI. 


Demostración. 
Sean A y B matrices semejantes, luego existe una matriz P no singular 
tal que A= PBP”!, Sea el polinomio de grado n 


dla) = A A 
Entonces, 


gn A) O E E A 

= ca (PBPOY" + en (PB 4 a (PB +... 
+a(PBP"") + col 
= Cal PBPPAA) + Cn (PBUOOIPOD +. o (PBRPOD +... 
+a(PBPD) +a(PP"?) 
=P(cpB" + aBU 4 + opBP+. .+aB+oL)P? 
=Plan(B)]P", 


como se quería demostrar. MM 


Teorema 3.17 Matrices semejantes tienen el mismo polinomio mínimo. 


Demostración. 
Sea ma(x) el polinomio mínimo de A. Por el Teorema 3.16, se tiene 
que 


ma(A) =P[ma(B)]P"* =0. 


Esto implica que ma(B) = O, es decir ma(x) es también el polinomio 
mínimo de B, porque por el Teorema 3.15 si existiera un divisor que se 
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anulase para B, también se anularía para A, lo que contradice la hipó- 
tesis de que ma(x) es el polinomio mínimo de A. Luego los polinomios 
mínimos de A y B son iguales. m 

El siguiente teorema establece una importante relación entre el poli- 
nomio característico y el polinomio mínimo. 


Teorema 3.18 Si A satisface un polinomio p,(x), entonces todo valor 
propio de A es también raíz de p,(x). Por consiguiente, todo valor propio 


de A es una raíz del polinomio mínimo de A. 


Demostración. 

Supóngase que Á satisface pn(x) = ana"+ap —12"71+...4a3r+apgró. 
Si A es un valor propio de A, entonces se puede encontrar un vector propio 
7 tal que AU = Av. Así, 427 = A(Av) = A(Av) = A(Av) = A(AD) = M0. 


Si se continúa de esta manera, se origina 
AG =>», para todo k > 0. 
Pero como pn(4) = 0, se tiene 


0 = pn(AJU = (an A” + an 1477? +... +01 A+ ap01)5 
= (an AT)U + (an-14"730+ L.. + (a1 AJU + (a01)T 
=p UH 0 1 APT 18H... +10 + agu 


= (a, A” A o TO E a) 0 = pp (A)0, 


como pp (A) es un escalar y pn(AJU = Ú con U % 0, se concluye que 
PnlA) = 0. Por ello, A es una raíz de pn(x). 

Puesto que A satisface su polinomio mínimo, todo valor propio de A 
es raíz de dicho polinomio mínimo. Ml 


Ejemplo 3.8 Encuentre el polinomio minimal que satisface la matriz 


dada en el Ejemplo 2.12. 


Solución. 
En el Ejemplo 2.12, se obtuvo que los valores propios de A eran A1 =0 
y Az = 2 (de multiplicidad algebraica 2). Como la multiplicidad algebraica 
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del valor propio A2 resultó ser igual a su multiplicidad geométrica, el 
polinomio 


pla) = (1-0) (1-2) = 1? — 2x2 
es satisfecho por la matriz A. Veamos que 
p(A) = A? -24=0, 


al sustituir la matriz A se tiene que 


2 


23 03 
LS EM E EN A 
E A 
6.4 6 6 4 6 0.0.0 
=|6318|-|6-3818|=|000 
22 A 10 2 «de 10 0.0.0 


Ejemplo 3.9 Encuentre el polinomio minimal que satisface la matriz 


dada en el Ejemplo 2.18. 


Solución. 

En el Ejemplo 2.18, se obtuvo que los valores propios de A eran A¡ = 1 
(de multiplicidad algebraica 2) y A2 = 7. Como se obtuvo que la multi- 
plicidad algebraica del valor propio A¡ era igual a su multiplicidad geo- 
métrica, el polinomio minimal es 


malx)=(u—1)(u —7) =x —8r +7. 


El lector puede verificar que la matriz A satisface este polinomio. 


3.4 Forma canónica de Jordan 


Ahora se considera una versión completa del teorema de Cayley —Hamil- 
ton, el cual fue estudiado en la sección anterior. Esta nueva versión será 
usada para la forma canónica de Jordan que estudiaremos ahora. La forma 
de Jordan utiliza todo el material estudiado en los capítulos precedentes. 
El lector que desee profundizar en este tema puede consultar Weintraub 


(2009). 
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Definición 3.6 Bloque de Jordan 
Una matriz triangular superior de tamaño r xr, FLA), es un bloque 


elemental de Jordan si se verifica que: 
¿) Todos sus elementos en la diagonal principal son iguales a A. 
1) Todos sus elementos en la primera sobrediagonal son iguales a 1. 


iii) Todos los demás elementos son iguales a 0. 


De este modo, A) es de la forma: 


[oa Edd 
Danes a 
TA) = | io io 1 con N, = | | 
0.0... A 1 o 
0.0... 0.A ¡E j 


donde N, es una matriz nilpotente de índice r. 
Nótese que las matrices Af, y N, conmutan entre sí. Como una matriz de 
Jordan está constituida por bloques elementales, su definición es la que 
sigue. 
Definición 3.7 Matriz de Jordan 

Una matriz J de tamaño n x n, de la forma 
Tm (A1) 0 0 Qe. 0 | 


0 Tmo(A2) 0 Pe. 0 
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en donde Ta, Tno,..-, In, son bloques elementales de Jordan de órdenes 


ni >N2>-*:*>mns con s > 1, se denomina matriz de Jordan. 


Teorema 3.19 Sea A una matriz real de tamaño n x n. Entonces existe 


una matriz P no singular tal que 


Ta == 0 
PTHAP=| 3 e 1 = (3.11) 


A 


en donde cada J,, es un bloque de Jordan de tamaño nz X nj y el 
subíndice py = 1 + a+... + is es igual a la suma de las multiplicidades 
geométricas de los valores propios distintos de A. Un mismo valor propio 
Aj puede estar en distintos bloques de Jordan J.,,,, pero el número total 
de bloques con ese valor propio es igual a su multiplicidad geométrica Uk, 
mientras que el número total de elementos en la diagonal principal con 
ese valor propio es ¿igual a su multiplicidad algebraica my. Los números 
nx y el número total de bloques quedan determinados de manera única 
por la matriz A. 
Demostración. 

Para identificar los pasos a seguir en la demostración, supongamos 
que Á es una matriz real de tamaño 2 x 2 que tiene un único valor propio 


A. Sea u1 el único vector propio correspondiente a A. Entonces A no es 
diagonalizable. Veamos que 


E | 
para [3] 


Como la multiplicidad algebraica es diferente de la multiplicidad geomé- 
trica, se encuentra un vector propio generalizado uz. 
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Por el Teorema 2.33, los vectores 4, y uz son linealmente indepen- 
dientes, luego P = [ ul Us ] es no singular. Por lo tanto, 


AP =A|[ ús ú2 ] =|[ A Aúz | =| Au Aus |]. 
Pero de la ecuación (2.37), se tiene que AU2 = Aú2 + U1, de manera que 
AP =| Mú Ala + Ur]. 


Por otra parte, 


oda A 1 


= [Ada ú + Az ]. 


Por lo tanto, AP = PJ, lo que significa que P71AP = J. Luego, el 
teorema es válido para matrices de tamaño 2 x 2. 

Para probar el teorema para el caso general, se escribe P en términos 
de sus columnas como 


P=[% da ... da], 


donde algunos u, son vectores propios generalizados. Consideremos %; 
como el elemento de una hilera de vectores encabezados por algún vector 
propio u;-1 y determinados por 


AU; = AU + OU; 1, (3.12) 


donde dy = 0, A; es el valor propio en el bloque de Jordan que afecta a 
ui y 
p, = O si u; es un vector propio, 
y 1 si u; es un vector propio generalizado. 


Nótese que si 6 = 1, entonces u; es el único vector adicional en la hilera y 
el bloque correspondiente de Jordan es de tamaño 2 x 2. Así, cada hilera 
produce un solo bloque en la matriz J. Luego, la clave para encontrar la 
forma de Jordan de A se convierte en la búsqueda de las hileras de los 
vectores definidos en (3.12). 

Básicamente, se tiene que mostrar de qué manera se pueden construir 
estas hileras para cada matriz A € Mnn. 

Empleando la metodología dada en Filippov (1971), se procede por 
inducción matemática, partiendo del hecho de que cada matriz de tamaño 
1x1 está ya en su forma de Jordan. La prueba consiste en suponer que 
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se logra la construcción para todas las matrices de orden menor que n 
(esta es la “hipótesis de inducción”), y después se aplican tres pasos para 
obtener la forma de Jordan de una matriz de tamaño n x n. Los pasos 
que se aplican son: 


(1) Se supone que A es singular, entonces su espacio columna [Col (A)] 
tiene dimensión p < n. En lo que respecta solamente a este es- 
pacio pequeño, la hipótesis de inducción garantiza que una forma 
de Jordan es posible; luego, deben existir p vectores linealmente 
independientes u, € Col(A) tales que 


AU; = AU + O¡U¡—1. (3,13) 


(44) Se asume que el espacio nulo [ker(A)] y Col(A) tienen una intersec- 
ción de dimensión q. Luego, cada vector del ker(A) es también un 
vector propio correspondiente al valor propio A = 0. Por lo tanto, se 
tienen q hileras en el paso (4) que comienzan a partir de este valor 
propio, y nos interesan los vectores u¿ que están al final de dichas 
hileras. Puesto que cada uno de estos q vectores está en Col(A), 
estos se pueden expresar como una combinación de las columnas de 
A, es decir: 


U = AU,, para algún U¡ ER”. 


= 


Se considera que v(A) = dim[ker(4)] = n — p. Entonces, inde- 
pendientemente de su intersección q-dimensional con Col(A), debe 


(iii 


contener n — p — q vectores básicos adicionales 0, fuera de esa in- 
tersección. 


Al juntar estos pasos, se obtiene el teorema de Jordan. 


Los p vectores u;, los q vectores %;, y los n — p — q vectores 1; forman 
las hileras de Jordan para la matriz A y estos vectores son linealmente 
independientes. Si estos vectores conforman las columnas de la matriz P, 
entonces P es no singular y P7+AP = J está en la forma de Jordan. 

Si se quieren renumerar estos vectores como Uj,Ux,...,Un y hacerlos 
corresponder con las condiciones de la ecuación (3.12), entonces cada U; 
se debe colocar inmediatamente después del u; del cual se origina; esto 
completa una hilera en la cual A¿ = 0. Los W%; vienen al final, cada uno 
solo en su propia hilera; de nuevo el valor propio es cero, ya que los ww; 
están en el ker(4). Los bloques que tienen valores propios diferentes de 
cero se completaron en el paso (1), los bloques con valores propios iguales 
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a cero crecen en una fila y una columna en el paso (1), y el paso (11) 
contribuye con cualquiera de los bloques de tamaño 1 x 1, J, = [0]. 

En esta construcción, el único punto técnico es verificar la independen- 
cia de toda la colección %;, U y W0¡. Supongamos que alguna combinación 
de estos es cero, es decir 


n=-p-=4q 


> QU; + $ BiU; + $ Yi; = 0. (3.14) 


a=1 et i=1 
Si se premultiplica por A y se usan las relaciones dadas en (3.13) para %; 


Pp 


Ya Qí [AjUs + 0jtt;-1] 1] + > piAm; = = O, (3-18) 


i=1l ¿=1 pl 


como los Av, son los u, especiales al final de las hileras correspondientes 
a A¿ = 0, no pueden aparecer en la primera sumatoria. Luego, (3.15) es 
una combinación de los u;, los cuales son independientes por la hipótesis 
de inducción (proporcionan la forma de Jordan en Col(A)). Por lo tanto, 
se concluye que cada 6; es cero. Si se reemplaza en (3.14), se llega a 


Como el lado izquierdo está en Col(A) y los 0, son independientes de ese 
espacio, cada y; debe ser cero. Por lo tanto, 


p 
) QU; = 
¿=1 


y de la independencia de los u;, se tiene que todos los a, = 0. 

_Si la matriz A inicial no es singular, se pueden aplicar los tres pasos 
a Á= A— kI,, (si se elige la constante k de manera que Á sea singular y 
que pueda ser cualquiera de los valores propios de A). El algoritmo pone 
A en su forma de Jordan P-14P=J al generar las hileras u; de las us, 
U, y W¡. Entonces, la forma de Jordan de A utiliza las mismas hileras y 
la misma P 


PLAP=P A+)? =STEP PES bn = 3. 


Esto completa la prueba de que cada A es semejante a alguna matriz de 
Jordan J. Excepto por el reordenamiento de los bloques, es semejante a 
solo una J. En este sentido, A tiene una forma de Jordan única. Ml 
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Definición 3.8 Forma canónica de Jordan 
La matriz J dada en el Teorema 3.19 se denomina forma canónica 


de Jordan de A. 


Ejemplo 3.10 
Encuentre una matriz P- no singular tal que la matriz A dada en el 


Ejemplo 2.22 sea semejante a una matriz de Jordan. 


Solución. 
En el Ejemplo 2.22, se obtuvo que el único valor propio de A era 
A = 2 de multiplicidad algebraica 3 y además los siguientes vectores 


propios generalizados para la matriz A: 


0 1 2 
Úl NN 1 . U9 = 1 y U3 E 3 
-1 0 0 

Por tanto, 
0 1 2 0.0 -1 
P=|1 13 y Pil=| 3 2 2 
1.0.0 1.1 1 


Al realizar el producto P7* AP, se obtiene 


0 0 -1 111 1 0 1 2 2150 
322 2 1 -1 113|=]/|0 2 1 
1 1 1 3.2 4 1.500 0.0 2 


Nótese que en la diagonal de la matriz de Jordan, aparecen los valores 
propios de A. 


Ejemplo 3.11 
Encuentre una matriz P no singular tal que P7*+AP sea una matriz 


de Jordan, para la matriz A dada en el Ejemplo 3.3. 
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Solución. 
En el Ejemplo 3.5, se obtuvo que A = 1 era el único valor propio 
con multiplicidad algebraica igual a tres, y además se encontraron los 
1 0 
siguientes vectores propios: 41 = | O | ,v = 2 | . Para encontrar un 
2 -3 


vector propio generalizado 13, se calcula 


(A — 1)U3 =c1Ú1 + C202 


4 3 2 z 1 0 
3 6 4 Y =C1|0|+0c 2 
4.3 2 2 2 3 


Al realizar las operaciones por filas, se obtiene 


a 3 | c1 43 2 | C1 
8 6 4 | 2ca mam [0 0.0 | 2c2 — 2c1 
4 3 2 | 2c—3c2 | R+r | 0 0 0 | 3c¡-—3c» 


Para que el sistema tenga infinitas soluciones, c1 = Ca; luego, 41 — 3y — 
22 = C1. Por lo tanto, 2 = 2x— 3y— 301. Si se hace z = y =0 y c1 = l, se 


0 
obtiene el vector propio generalizado: Uz = l 0 | . Por consiguiente, 
1 
10 1-50 
E E y O 
2 1 4 3 2 


Obsérvese que la segunda columna de P es una combinación lineal de los 
dos vectores propios que constituyen la base del espacio propio asociado 
al valor propio A = 1. Si se realiza el producto PAP, se llega a 


1-50 53 2 1.1.0 1.0.0 
0.3 0 8 5 4 O 2 Y lb=10 1 
43 2||4 3 3 2 1 2 0 0 1 


El lector puede notar que sobre la diagonal de la matriz de Jordan se 
encuentra el respectivo valor propio de la matriz A. 
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Ejercicios 3.2 


1. Sean pa(x) = 2? — 2x2 — 3, qa(a) = a? — 3x— 2 y las matrices 


1.2 1 41 
-1 3 3-1 
Determine: 
a. pa(A). b. pa(B). c. q2(A). d. q(B). 


e. p(A+B). f.pl(AB). yg. q(A+B). h.qí(AB). 


2. Calcular el polinomio mínimo y la descomposición de Jordan de las 


siguientes matrices: 


6 1 8 7 4 1 
a b. C 
1 4 7 6 1 2 
3. ll [2 1 
a —b 
d el 3 fl 1 DA 
b e 
2 1 2 2 3 2 


3. Encuentre todas las respectivas formas canónicas de Jordan para 
las matrices cuyos polinomios característicos pa (x) y minimales 


MA (x) son los siguientes: 


a. pa(x) = (a — De — 3), malz) = (x = DE - 3). 


b. pa(u) = (2-5), ma(u) = (a 5). 
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4. Demuestre que la m-ésima potencia de la matriz de Jordan es: 


IRA) 0 0 Qe. 0 
0 Ti(A2) 0 2. 0 

JM= : cs AA pla : 
0 e O AAA 


0 es 0 se) | 


donde la m-ésima potencia de un bloque de Jordan de tamaño ny X 


Nx, para m < nz-1, es dada por 


la Ri AER | 
o a As DE 
Tin Ak) = : : 
o. 0 e E | 
0 0 0 a | 


3.5 Raíces cuadradas 


Si se considera un número a € R, como ay? = a?, es evidente que 
para cualquier a > 0, se tienen dos raíces cuadradas; una positiva y 
otra negativa; mientras que cuando a < 0, sus raíces cuadradas son dos 
imaginarios puros, una raíz es la conjugada de la otra. En general, si 
a € C, también a tiene dos raíces cuadradas distintas. En esta sección 
se extiende el concepto de raíz cuadrada para estudiar la raíz cuadrada 
de una matriz de tamaño n x n, tema poco trabajado en la mayoría de 
textos de álgebra lineal. 


Definición 3.9 Sea A una matriz real de tamaño n x n. Una matriz X 


de tamaño n Xx n se llama raíz cuadrada de A si cumple que 


X= A. (3.16) 
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La matriz X puede tener algunos elementos complejos. 


Cuando la matriz es de tamaño 2 x 2, existe un método sencillo para 
determinar sus raíces cuadradas, el cual fue presentado en Cayley (1858, 
p. 25) y es dado en el teorema que sigue. 


Teorema 3.20 Método de Cayley 
Sea A una matriz real de tamaño 2 x 2, entonces la raíz cuadrada de 


A viene dada por 


1 
E A EN 3.17 
tr(A) + 20 2 Ses 


donde 4 =+,/det(A). Cuando tr(A) +26 4 0 entonces A tiene 4 raíces. 


Demostración. 
Sea A = E cla Luego si la matriz dada en (3.17) es la raíz cuadrada 


de A, entonces A = (42) (42) 


(43) = il pa b ] 
ytr(4) + 2 det A B d+ Y det A 
1 a2 + ad + 2av det A ba + bd + 2bv det A 
tr(A) +2Vdet A | ca+ cd + 2cyv det A da + d2 + 2dVdet A |' 


De este modo, 


112 _ (a+d) +2vdet A a b 
(42) —tr(4) +2vdet A E Al 


Pero como tr(A) = a + d, se tiene que 


(ay 4.0 


Ejemplo 3.12 Determine para cada una de las siguientes matrices, una 


raíz cuadrada: 
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Solución. 


e Para la matriz A, se tiene que 
tr(A) =4 y det A =4. 


Como tr(4) = 2V det A, entonces A posee 2 raíces cuadradas. Una 
raíz cuadrada de A sería 


= A 0 nasa dl 


y multiplicando por —1, se obtiene la otra raíz. 


DiR 


A 


2 
El lector puede verificar que (42) = Á. 
e Para la matriz B, se tiene que 
tLB) =8 y det B =20. 


Como tr(B) 4 +2vVdet B, entonces B posee 4 raíces cuadradas. 
Una raíz cuadrada de B es 


1 Irá 2 Az VyV/5—2 


B3 


cai vl 2 14245 1152 1V5+2 


1 e a ] 
Nótese que —B2 también es raíz y otra raíz cuadrada de B es 


ZA [ea 2 |= vVYV5-2 -Vyv5+2 
2 242-45l. 2 414-245] | yv5+2 vv5-2 


1 eN y 
En este caso, —B2 también es raíz; el lector puede veficarlo. 


du 


Teorema 3.21 Sea D = [d;¡] una matriz real diagonal de tamaño n xn, 


entonces una raíz cuadrada de D es: 


y d11 0 03% 0 


O  YVda ... 0 
AN la (3.18) 
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Demostración. 
Queda como ejercicio para el lector. M 


Nota 3.2 Como cada elemento d;¡ tiene dos raíces cuadradas y d;¡ y 
—vd;¡, entonces en la matriz (3.18), se puede reemplazar por la otra raíz 


del elemento d¡¿ y se obtiene una nueva raíz cuadrada para D. 


Teorema 3.22 Sea A una matriz real de tamaño n x n diagonalizable y 
sea P una matriz no singular tal que la matriz D = PAP es diagonal. 


Entonces una raíz cuadrada de A es 
Az =PD3P", (3.19) 


donde D3 es definida como en (3.18). 
Demostración. 

La demostración consiste en un cálculo directo, 

(a+) =(PD3P=2(PD3P=") =P(D3)?P2=PDP"=A. 
Así, queda el teorema probado. Mi 


Cuando son iguales la multiplicidad algebraica y la multiplicidad geo- 
métrica de los valores propios de una matriz A, se tiene que Á es semejante 
a una matriz diagonal D cuyos elementos son los valores propios de A. 
Por lo tanto, si A es diagonalizable como cada valor propio tiene dos 
raíces cuadradas, entonces el número de raíces cuadradas de la matriz A 
es igual a 2”. Si todos los valores propios de A son nulos, entonces A no 
tiene raíz cuadrada. 


Ejemplo 3.13 Determine las raíces cuadradas de la siguiente matriz: 


12 1 23 EN 

YT 11 == 12 
dE | ) 
0 <3 16 1 | 


3. 4 7 15 
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Solución. 


Para la matriz A, se tiene que el polinomio característico es 


PAlA) = A! — 54% + 9694? — 66764 + 14400. 


Entonces, sus valores propios son A¡ =4, A2 =9, A3=16 y Ay = 25. La 
matriz Á se puede expresar como 


2 23 115 115 
3 74 144 “252 40.00 0 LA 
12%-B 0 0.9.0.0 >. 3 3 0 
A=|1 % on 0.016 0 MEE O. «22 
FRE] [4 Fa E 
3 0 Tu 3 00.0 2S|l5 0 1 15 


Como A tiene 4 valores propios distintos no nulos, entonces posee 2% = 16 
raíces cuadradas, al tomar todas las raíces positivas de los valores propios 


223 115 115 


2 

e E 
Ás - -1 “A AS 0 0 3 0 0 2 733 733 0 

11.23 11 115 0040 48  _ 48 0 48 

¿dh m8 Be 15 a $ 

3 0 14 000 51Ls % m1 

10 1 0 5 


1.2311 


Para obtener las otras raíces cuadradas de la matriz A, se modifican los 
1 A “ 

elementos de D2 por las raíces negativas de los valores propios, como se 

muestra a continuación 


10 9 s -13 | 2.000 | 
1 1 3 3 -15 18 1 03050 
A2 =3l 4316 5 cuando D2 = ooao0l' 
1 6 7 7 0.0005 
8 17 -18 5 20.00 
1 1 21 27 15 6 1 030.0 
a E ia EE 
-1 2 3, ¿Ll 0.0005 


3.5. Raíces cuadradas 


167 


6 3 

1 TT 5 
a E 
q 0 

o 1 

1 113 9 
2 6 -1 
9 2 


O 1 
-1 6 z 1 
4 5 asumiendo D2 
1 1 
10 5 | 
3 6 1 
2 11 con D2 
7 1 


ooov O0O00mNn 
OO0OwO OOOO 


OS*RoooLsnoo 


A | 


2000 nooo 


! 
al 
Lo 


; 1 : , 
Nótese que en la matriz D2, se ha modificado solo un valor propio; ahora, 
se consideran las raíces cuadradas de A cuando se cambian dos valores 


propios. 
año! 
3 
añ=! | 
3 
0 
1 1 
A2 = 9 


3 


2 
-1 


-15 
16 
7 


3 
2d] 


cuando 


tomando 


asumiendo 


2 
0 
0 
0 
2 
0 


o 


dy O 


2000 00w0 20 


nO O0OO nooo 


CS*Roo ooo omnoo 


sl 


Se puede verificar que estas 8 matrices y sus respectivas matrices negati- 
vas son las 16 raíces cuadradas de A. 


Teorema 3.23 Sea T = [t;¡] una matriz triangular superior de tamaño 


n xn, con a lo más un elemento nulo en la diagonal. Entonces, existe 


Pos [Ti] y sus elementos cumplen que 


Taj = 


tii 
Tii + Ty 
1 ql 
ra [ta E, ram 
Ti E T5j k=i+1 
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Demostración. 
La demostración es por inducción sobre n. Vamos a probar que si 
los elementos dados en (3.20) son las entradas de la raíz cuadrada de T, 


entonces 
1 1 
T= (73) (13). 


Sin= 1, T = [t] es una matriz real de tamaño 1 x 1 que es triangular, 
luego 


2 
(13) =[ vi =([] =T. 
Para n = 2, se tiene que 


t12 E vt11 + vV to9 
112 v ti. —_ == t t19 == 
(73) > V tii + vV taa — di e vt + Vta —= E 


0 vV taa 0 taa 


supóngase que es cierto para todas las matrices triangulares de orden 
n — 1, es decir que existe una matriz de tamaño (n — 1) Xx (n = il, 


T11 712 T13B --- Tin—1 
M 0 TI TB. «x. T2m—1 
Dn eS 0.0 7 iria T3m — 
Dcál — | 33 3n—1 5 
0 0 0 ci. nl n= 1 | 
1 32 
tal que A ,) = T, —1. Como una matriz triangular 7' de orden n, se 


puede particionar como 


. > tin 
Tr A U _ Lo 
TE e : donde U = . , 
o' £nn tn— in | 


por la hipótesis de inducción 


1 . 
ss € 


n-1 


1 
Ta = Du > con Tan = Vinn» 


0% E A 
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y con 
d n-1 
Tu PTan tin — y T1kT kn 
Tin = 
n-1 
T2n 1 
E€= j = 722 + Tn (ta, = e 0210) | . 
Tn—in | : 
tn-1n 
Tn-1n-1+Tnn 
Luego, 
á 2 ; > a 
pa E Lal Tai tmin=4 e 
41.2 n-—1 
(13) = = 
3 Tm 0' E 


An > 
Nótese que 3 ¡+ Suala-1) c=U, 


(711 + Tan) T12 sao Tin—1 Tin tin 
0 (722 + Tha) suo T2n — 1 T2n tan 
0 0 ee T3m—1 T3n = t3n 


0 0 ... (m0 ai HTan) | Tn—1n | tn— in | 


Esto completa la prueba. Ml 


Ejemplo 3.14 Determine una raíz cuadrada para la siguiente matriz: 


4 15 27 19 

0 9 21 22 
A= 

0 0 16 18 

0.00 0 25 


Solución. 
Usando el procedimiento descrito en (3.20), se tiene que 


Ta =vVtu =2, T22 = vVt22 = 3, 733 = vVtg3 = 4, 
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t19 23 
Tas = Vt44 =D, 112 == =3, 7233 === T—-=3, 
T11 + 792 T22 + 733 

34 t13 — (r12723) tas — (23734) 

T34 == 52 T13 == A T4 = == —= 
) ) 
733 + Taa T11 + 733 T22 + T44 

finalmente 


t1a — (Ti2724 + 713734) 


Tia = = le 
sá T11 + 744 
luego, 
23 34d 
1 033.2 
E: 
0.0.0.5 


2 
El lector puede verificar que (4) = A. 


Teorema 3.24 Sea A una matriz real de tamaño n xn con valores pro- 
pios reales (a lo más uno igual a cero) y sea P una matriz no singular tal 
que la matriz, T = PAP es triangular. Entonces, una raíz cuadrada 


de A es, 


E 
! 
“Y 
ñ 
Y 


(3.21) 


donde los elementos de T? están dados en (3.20). 


Demostración. 
La demostración consiste en un cálculo directo 


(ay =(PT3PD(PTEP=") =P(T3y 


Así, queda el teorema probado. Mi 


Hasta este momento hemos considerado las raíces cuadradas de matrices 
diagonalizables o triangularizables, pero como todas las matrices no se 
pueden factorizar de esta manera, a continuación se presentan algunos 
métodos para obtener las raíces cuadradas de una matriz. 
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Teorema 3.25 Si A es una matriz real de tamaño 3 x 3 con a lo más 


un valor propio nulo, entonces sus raíces cuadradas son 


A? =[4+a1] *[84+ (mv vA3)1, (3.22) 


donde a. = y y (VA y/Aj) Y 9= E V%. 


i=1j= +1 
El teorema es válido para cualquier matriz; sin embargo, la prueba que se 
presenta en este material es únicamente para matrices triangularizables. 


Demostración. 

Supongamos que Á es una matriz cuadrada con valores propios reales. 
Por el Teorema 3.7, es semejante a una matriz triangular superior T', luego 
puede expresarse como 


A=QTO", (3.23) 


donde (2 es una matriz ortogonal y 


A1 qa 10 
E=| UU Aj El, (3.24) 
0. 0 A 


Con A1,A2, A3 los valores propios de A. Al reemplazar (3.23) en (3.22), 
se tiene que 


Aé =[QTQ! +01] [A(QTO!) + y/dex(QTQ)1] 
= [Q(T +a1)Q7 *[Q(8T + Viet TN) Q” 
=Q[T +01] *Q'Q[ST + Viet TI] Q* 
=Q[T +01] [87 + Vdet TI]Q*. 


Es decir, al utilizar la descomposición de Schur, se llega a que 
A? =QT2Q!. 
Luego, se debe demostrar que 


T2=[T +01] *[8T + Vdet TI, (3.25) 
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Para ello, se define 


ij = VA + Y Aj: (3.26) 


Esto permite factorizar a; y 8 de la siguiente manera 


a =vYVMvYVA + VAL VAz + VA2/Az = M2 A13 — A 


= A12 423 — A2 = A13 423 — Az 
A12 A13 — VA2A 
8 = Mo hd = 12113 23 


VA 
_A12 423 VA143 _ 413423 — vA1%2 
VA2 VAz 
Por lo tanto, 
Md a b 10.0 
T+al =| 0 » c | +[(vYM%+vVMA3+4A243) | 0 1 0 
0 0 A 0.0 1 
A12 A13 a b 
= 0 A12 A23 c 
y si se hace £ = A12 A13 A23, entonces 
1 4 db 
A23 $ 3 
T+ol=£| 0 ¿ ; 
O 
luego su inversa es 
7 
o As —m3 E SE 
(T+aDb)” = ¿ 0 Ms —% | (3.27) 
0 0 A12 
Por otra parte, 
Az a b 1.0 
BT +vVdetTI=(VA+vVM+vV%)| 0 Ac |+vVX%M%2%|0 1 
0 0 As 0.0 
la cual en términos de €, se puede expresar como 
Ya ¿2 ¿2 
A23 É € 
BT+vVdeTI=E| 0 2 cÉ (3.28) 


> 
a 
w 


3.5. Raíces cuadradas 173 


Al reemplazar las matrices obtenidas en (3.27) y (3.28), en la expre- 
sión (3.25) se tiene 


El lector puede verificar que los elementos de esta última matriz coinciden 
con los dados en el Teorema 3.23. Mm 


Ejemplo 3.15 Determine las raíces cuadradas para la matriz dada a 


continuación: 


Solución. 
El polinomio característico de la matriz A es 


PA(A) =-A +51? 81+4. 
De esta suma, se tiene que 
A =1, A2 =2 y Az = 2. 
Como A tiene 2 valores propios distintos no nulos, entonces posee 2? = 
4 raíces cuadradas. Si se consideran las raíces positivas de los valores 
propios, se tiene que 
a =2+242 y fB =1+242. 


Por lo tanto, una raíz cuadrada de A es 


A? =[4+ (2+2v2)1] *[(1 +2v2)4 +41), 
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al sustituir se tiene que 


sao 1 2 a 19+4y/2 1] 2 
A3d=(1+2/2) | -1  4+242 -1 1 24 y 
—1 1 24242 e 4y 2-2 
dl 1 7 
ava=s [| 3+2V2 4-2V2 2425 1944v2 1 2 
== il dina 1 1 247 
1 2/24 9 _ 4y/2-2 
1 1 > 
yA o ao a 


, =1 4-7 2 


1 do A á ó 
Nótese que — 42 también es raíz, verifiquemos que en efecto son raíces 


cuadradas 
a al? 2424 5-22 5 2y2-4 5-22 
(+43) = | 4 ai 1 4 E 
E A A | E O O O A | 
S «=l. Y 
= ll TT =1 
Il 1 8 


Si se consideran las raíces negativas de los valores propios iguales, se tiene 


que 
a =2-2y2 y PB =1-2y2. 
Por lo tanto, otra raíz cuadrada de A es 
A3 =[4+ (2- 2/21] *[(1-242)4 + val] 
5-242  —1 2 E ob/2 2/21 Dela 


== —1 4—2y2 —1 2V2-1 4-4y2 242-1 
—1 1 2- 242 242-1 1-2y2 2 
20:98 3-22 2/42+4 -242-5 5-6y2 242-1 2-4y2 
= 3 dl 4-—2y2 il 2V2-1 4-4y2 242-1 
dl -242-4 9 2v2-1 1-2y2 2 
7 e die 4177 


a l 
Í =d- A/D 1aedya 
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El lector puede verificar que esta matriz y su respectiva matriz negativa 
también son raíces cuadradas de A. 


Teorema 3.26 Si A es una matriz real de tamaño 4 x 4 con a lo más 


un valor propio nulo, entonces sus raíces cuadradas son: 


A? = [a A+ BT] 42 +74+ (Ya vv], (3.29) 


4 
dd Je VAp, pe. Y VAYA VA Y 7= DD) VA Aj: 
=1 y 


> ¡> 


Demostración. 

Supongamos que Á es una matriz cuadrada con valores propios reales. 
Por el Teorema 3.7, es semejante a una matriz triangular superior T. 
Luego, puede expresarse como 


A=QTO", (3.30) 
donde (2 es una matriz ortogonal y 


AM a bc 
O dd e 


T=lob a sl (3.31) 


0.0 0 A 


Con A1, A2, Az, As los valores propios de A. Al reemplazar (3.30) en (3.29), 
se tiene que 


A? =[aQTQ* + 8D] *[(QTQ)+yQTQ! + [det (QTQ*)] 
= [Q(aT + 80) QU] "[Q(T? +yT +vVdetTD)Q” 
=Q[aT + BI] *Q'Q[T? + yT + Vdet TI] Q! 
=Q[oT + B1] [12 +yT +Vdt TD Q!. 
Es decir, al utilizar la descomposición de Schur, se llega a que 
A? =QTIQ!. 
Ahora, se demuestra que 


T?=[aT +81] *[T? +yT + Vder TI]. 
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Usando la expresión (3.26), se calculan a, PB y y, como sigue 


a =A12 + Aza, 


B = VA VA A34 + 1 Az y AsA12, 
y = VA1k3 + VA2Aza + VAA3. 


Luego, se tiene que 


donde 


4 
wi = II Asj» 


¡Ai 


y la inversa es 


w aa ba 
wa da 
0 ua 

0.0 


acad—wab y oPadf-aw3zae-awabf+wwz Cc 


¿=1,2,3,4, 


do Ma 
da sz 
T3 
0 
T2=0w1 
T4 = Y1 


Q ni 
= 12 
fa A34 


Ta 


da f-ew3 


ES 1 
RS 
0 0 
donde 

a _A24 A23 
1 x a du “da 
E Ma A12 
3 LE e a 

É = w171 


Por otra parte, 


Pe a(M + 42) blA + A3) + ad (A + A) +ae+bf 
e(A2 + A4) + df 
F0O3 +1) 


W272 = WaT3 


q2_| 0 A d(A2 + Ag) 
10 0 AZ 
0 0 0 


Wa4TA. 


A 


l 
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por lo tanto, la matriz 7? + yT + y/det(T)I es igual a 


wyYM ak +52 bovd+32+ad coyd +3 +ae +bf 


0 wa Va do Aa + $2 coy da + $2 + df 
0 0 wav Az fav + da 
0 0 0 wav Aa 


Al realizar los respectivos productos, se llega a 


/ a bad c bf ae Q 
A M2 M3 Ta Ma 7 7 ade 
e af 


d 
ri=| 0 v% y lam 
o «0 LL 
o 0 0 MI 


El lector puede verificar que los elementos de esta última matriz coinciden 


con los dados en el Teorema 3.23. E 


Ejemplo 3.16 Determine, mediante el método descrito en el teorema 


anterior, una raíz cuadrada para la matriz dada en el Ejemplo 3.13. 


Solución. 


Como en el Ejemplo 3.13 se obtuvieron los valores propios de A, se 


tiene que 


a=vV4 + V9 + V16 + v25=14, 
B= V4V9V16 + V4V9V25 + V4V 1625 + V9IV16V25 = 154, 


y =vV4vV9 + vV4v16 + V4V25 + vV9V16 + vV9V25 + vV16v25 = 71. 


Por lo tanto, la matriz aA + 61 es 


322 14 -28 -154 
98 308 -70 168 | 
-140 -42 378 -14 |” 

42 56 98 364 | 


y por otra parte, la matriz 4? + yA + Vdet AJ es 


1176 56  -280 -1064 

672 1092 -420 1092 
-1008 -308 1540  -28 

-336 364 700 1484 
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Luego, la raíz cuadrada de A es 


76 «11 <6 87 1176 56  -280 -1064 
ab 1 |21 87 27 -48 672 1092 -420 1092 
22680 | 26 5 60 11 -1008 -308 1540  -28 
5. 16-21 -336 364 700 1484 
10 1 0 5 
_1|3 9 3 6 
Sa Ll 1 A]? 
ll DG 


la cual coincide con una de las obtenidas en el Ejemplo 3.13. 


Teorema 3.27 Si A es una matriz real de tamaño nxn (n > 5), con una 
descomposición de la forma A = PBP"!, entonces sus raíces cuadradas 
se calculan de la siguiente manera: 

2 
B.0 ... 0 | 


pr, (3.32) 


en donde cada submatriz By es de tamaño 1x1,2x2,3x304xXx4, 
de tal manera que se le pueda calcular a cada bloque una raíz cuadrada 
como las dadas en (3.17), (3.22) o (3.29), respectivamente. 
Demostración. 


Queda como ejercicio para el lector. M 


Ejemplo 3.17 Determine una raíz cuadrada para la siguiente matriz: 
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Solución. 


Para la matriz A, se tiene que el polinomio característico es 
pA(A) =-A5 +8? — 204, 
luego se tiene que 
A1 =0, Aa =4+ 21, Az =4-— 21. 


Como A tiene valores propios complejos, usando el método de factoriza- 
ción dado en (2.22), se tiene 


8 4 2 o 1 1 4 2 0 o 1 1 
7 1 3|=|Y1 1 1 2.450 111 1 
13 1 1.02 0.00 1 2 
Luego, la raíz cuadrada de A es 
1 
y 1 0 -1 -1 4 2 0]? 2 2 
A? = 3 111 1 2.450 3 1 1 
1.02 0.000 1.1 -1 
¿[0-1 4 212 0 2.20 
=311 11 2.4 0 E 
1.02 0.0 0 1 1-1 


Si se usa una de las raíces cuadradas encontradas en el Ejemplo 3.12, se 
tiene que 


Mi 1 -<Í 4+245 2 0 e 
1 1 

A? => 1.1 1 2 4+2y5 | 0 o 
LO 2 0 0 0 Ll Tí. ad 

i O. =T 25+1 245+3 1 

=A4|1 1 1 3 35 Lo yo 643 
1.0.2 0 0 0 
i 8+3V45 4+vV5 2-45 


14+0/5 342/5 1 
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nia 
A 
[5] 
! 
> 


donde A =24/2+ v5. Se puede fácilmente verificar que (4 


E 1 2[8+3V58 44+V53 2-45] 
(4) = (3) T=V5 yY5-1 3+v5 
24 v5 14245 32+2/5 1 
j 64+3245 32+16y5 -16- 85 
=—_ 2 Hb =28/5. ¿4/5 2141045 
10+V8) | 834/5 2+12/8 8+445 


8 4 -2 
=|-7 1 3 
113 1 


3.5.1 Raíces cuadradas de matrices simétricas 

De manera análoga a la Sección 2.4, en la cual se desarrolló el tema 
sobre diagonalización para matrices simétricas, en este apartado se pre- 
senta por separado la parte concerniente a raíces cuadradas para matrices 
simétricas. 

Teorema 3.28 Toda matriz simétrica A de tamaño n x n tiene valores 
propios positivos si y solo si existe una matriz simétrica B de tamaño 


n xn tal que 


A=B?. (3.33) 


La matriz B se denomina una raíz cuadrada de A. 


Demostración. 
Si los valores propios de A son positivos, entonces det(A) > 0, y por 
ser simétrica, se puede factorizar de la forma 


4 =QDQ'=0(D3) 0! 
= (9030) (0D+0') 
= B'B. 


Nótese que B es una matriz simétrica y de rango n (como 4), por lo tanto 
B*B = B?. La matriz D? = diagí VA; y semejante a B está definida como 
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en (3.18). Además, si se consideran únicamente las raíces positivas de los 
valores propios, la matriz B tendrá también valores propios positivos 
(como 4). Ml 


Ejemplo 3.18 Determine una raíz cuadrada para la matriz dada en el 
Ejemplo 2.18. 


Solución. 
Haciendo referencia al Ejemplo 2.18, se tiene que 


1/42 1/43 1/v6 l 
o = 0  -1/V3 2/v6 y D 0 
1/42 1/V3 1/v6 0 


Por lo tanto, 


! 
ono 
=oo 


1/42 1/vV3 1/6 1.0.0 1/42 0 1/2 
BS 0  -1/v3 2/v6 0.1 0 1/43 -1/V3 1/v3 
1/42 1/v3 1/v6 0 0 v7 1/46 2/v6 1/v6 
1/v2 1/V3 1/v6 1/42 0 1/42 
a 0  -1/V3 2/v6 1/43  -1/V3 1/3 
1/42 1/43 1/v6 V7/V6 247/V6 vV7/V6 
Es decir, 


5+vV7 -24+247 -14+vV7 
B==|24+492/7 24447 2$24/7 
1447 24247 5+v47 


El lector puede verificar que A= B? . 


De acuerdo con la Definición 2.7, las matrices reales cuadradas A y B 
se dicen que son congruentes si existe una matriz P no singular tal que 


A=P*BP. 


En ocasiones, además de establecer el hecho en sí de la congruencia, se 
requiere encontrar la matriz P de la transformación que satisface A = 
P* BP. En estos momentos, se puede construir la matriz P para matrices 
simétricas no singulares A y B utilizando la descomposición LDU de 
cada matriz y una de las raíces cuadradas de D, como sigue 


12 _1 
P=LaDiD LO, (3.34) 
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donde las descomposiciones LDU para las matrices A y B son LaDAL%, 
y L pDgLt, respectivamente. 


Ejemplo 3.19 Determine si las matrices dadas en los Ejemplos 2.18 


y 3.3 son congruentes. 


Solución. 
La factorización LDL* de la matriz dada en el Ejemplo 2.18 es 


e | 1.0.0 20.0 dl ? 
A E 0.30 0 1 3 | =LaADaLi. 
123 331 0.02 0.0 1 
En el Ejemplo 3.3, se obtuvo que 
1.3 5 1 0-0 1.0.0 1.3 
3 18|=/3 140 0.30 0 1 1 | =£55D8L%. 
5 18 30 51 0.0.2 0.0 
Por lo tanto, 
100][Y92 0 0 0 1.0.0 
pPp=l110 0 y3 0 0 3.10 
ld 1 1 
3. 0.0 Y 2-1 1 


—— ogro 


1 

0 

0 

0 

0 
1/2 3v21-1 ¿-¿v21 ¿v21 
El lector puede verificar que A = P*BP. 
Teorema 3.29 Una matriz simétrica A de tamaño nx n tiene todos sus 


valores propios positivos (A; > 0) si y solo si: 
ASPE (3.35) 


donde P es no singular. 


Demostración. 


Si A es simétrica y todos sus valores propios son positivos, entonces 
puede escribirse en la forma 


A =QDQ! = (QD?)(D3Q*) = PP, 


con P = D2Q' y Di = diagí VA; y definida como en (3.18). Mm 
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3.5.2 Descomposición de Cholesky 


Entre los tipos de factorizaciones para la matriz A, existe una descomposi- 
ción especial para aquellas matrices cuadradas cuyos valores propios son 
todos positivos conocida como descomposición de Cholesky, considerada 
en este apartado. 


Teorema 3.30 Descomposición de Cholesky 


Si A es una matriz simétricade tamaño n x n con todos sus valores 


propios positivos, entonces existe una matriz L triangular inferior tal que 
ASLP, (3.36) 


donde todos los elementos en la diagonal principal de L son positivos. 


Demostración. 
Por el Teorema 3.5, la matriz A se puede expresar como 


1 1 1 1% 
E (1D) (D31s) = (1D*) (LD*) 
donde D? está definida como en (3.18) y la prueba queda completa. Mm 


A continuación, se presenta un procedimiento para encontrar la descom- 
posición de Cholesky. 


Procedimiento para encontrar los elementos de R = D3L! 


e Para 1= 1, se tiene 


e TEL 
P1j5 = 


-1 ; 
Pii015 J> L 


e Cuando ¿ > 1, se obtiene 
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El procedimiento exige que estos elementos se calculen por filas, de iz- 
quierda a derecha y de arriba para abajo. 

Si no se puede obtener la descomposición de Cholesky de una matriz 
(por ejemplo, cuando al realizar el procedimiento presentado arriba surge 
una raíz cuadrada de un número negativo), esto es indicio de que la matriz 
simétrica no tiene todos sus valores propios positivos. 


Ejemplo 3.20 Encuentre la descomposición de Cholesky para la matriz 


simétrica dada en el Ejemplo 3.3. 


Solución. 
Usando el procedimiento descrito anteriormente, se tiene que 


ri =vy0a1 =1, ri = ri 012 = 012 =3, 

Tis == =5, ra2 = 4/27 — ri) =V3, 

raz = e (a93 = ri2113) = V3, 33 = 4/Q33 — ri e 133 = v2. 
Luego, 


1.3 5 
R=|.0 4/8 3 
0 0 y2 


El lector puede verificar que A = RR. 


Ejercicios 3.3 


1. Si A es una matriz real de tamaño nx n con valores propios distintos 
A1,A2,..., An, usando la descomposición de Sylvester pruebe que la 
m-ésima potencia de A está dada por 

n 
A” = Y APE(), m € Z; (3.37) 
¿=1 


cuando m € Q, este resultado también se cumple. 
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2. Para cada una de las siguientes matrices, determine (en caso de ser 


posible) una raíz cuadrada: 


1 1 e UA 1 -1 do 2 
a b GC. d 
al Y 3 a sl 8 4 3 
Z 2 31 31 4 3 1 1 13232 


3. Determine la descomposición de Cholesky para las siguientes ma- 


trices: 
1 1 1 3 1 1 
a d. C 
1 3 3 -1 =I 1 
13 2 3-1 4 
d.| 3.1 2 A E E 
2.32 1 45 2 


4. Determine las soluciones de las siguientes ecuaciones matriciales: 


a. X?—3X =A, con bd. X?-4AX -—3I=B, con 
3 3 ol 724 

A=| 2 5 2 B=| 2 7 A 
3140 4 4 1 


3.6 Descomposición en valores singulares 


Una factorización especial para cualquier matriz A de tamaño m X n es 
la descomposición en valores singulares (SV D, por su sigla en inglés), la 
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cual es una de las factorizaciones de matrices más útiles en álgebra lineal 
aplicada. 


Definición 3.10 Valores singulares de matrices cuadradas 

Los valores singulares de una matriz real A de tamaño n x n son las 
raíces cuadradas de los valores propios asociados a la matriz simétrica 
AA (listados con sus multiplicidades algebraicas). Estos valores se deno- 


tan por 0,,03,...,0n, y se colocan en orden decreciente: 


01202200206 >0, 


donde 0; = YA; para 1<:i<mn. 


Ejemplo 3.21 Determine los valores singulares de la matriz: 


0] 


A=|3 1 2 
-1 1 1 
Solución. 
La matriz A%A es 
13-11 132 11 5 3 
3 1 1 3-1 2 = 5 11 3 
2 2 1 1.1 1 3 3 9 


En este caso, la ecuación característica es 
det(A'A— AL) =—A% + 314% — 2764 + 576 =0. 


Entonces, los valores propios de A*A son A¡ = 16,2 = 12 y Az = 3. Por 
lo tanto, los valores singulares de la matriz A son 01 = 4,07 = 243 y 


03 = Y3. 


Teorema 3.31 Si A es una matriz simétrica, los absolutos de los valores 


propios son los valores singulares. 
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Demostración. 
Como A = A? todos sus valores propios A; € ¡R, entonces 


det (AA —- a7I) = det (4? - a7I) 
= det(A — lo|1) det(A + lo] 1), 
luego 


Oi = Ai 0) Oi = —Aj. |] 


Cuando A es una matriz real de tamaño n x n, sabemos que las 
matrices A%A y A4' tienen los mismos valores propios con las mismas 
multiplicidades algebraicas. Por lo tanto, en la Definición 3.10 se puede 
cambiar AA por 44*. Mientras que si A es una matriz real de tamaño 
mxmn, con m 4 n, las matrices A?A y A4' tendrán n y m valores propios, 
respectivamente. Por consiguiente, cuando la matriz no sea cuadrada, sus 
valores singulares se definen de la siguiente manera. 


Definición 3.11 Valores singulares de matrices rectangulares 
Sea A una matriz real de tamaño mxn (m 4 n), los valores singulares 


son las raíces cuadradas de los valores propios comunes a las matrices 


simétricas ALA y AA!. 


Ejemplo 3.22 Encuentre los valores singulares de la matriz: 


1323 
A= 
1. 1 1 
Solución. 
La matriz 44! es 
Lea a SS a 
1.1 1 Em 0 3 


cuyos valores propios son A; = 14 y A2 = 3. La matriz A%A es 


1 1 2.2 3 
3 1 E ] e 2 10 5 
2 1 3.5 5 
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En este caso, los valores propios de 4fA son A¡ = 14,A2 = 3 y Az = 0. Por 
lo tanto, los valores singulares de la matriz A son 01 = Y 14 y 07 = Y3. 


Teorema 3.32 Sea A una matriz real de tamaño m x n que tiene r 
valores singulares no nulos 11 > 09 >... > 0. >0 con 0741 = 0742 = 


...=07 =0, entonces el rango de A es r. 


Demostración. 

Sea (5, Va... Day una base ortonormal de ¡R” formada por los vec- 
tores propios asociados a 4*A, y ordenados de tal forma que los valores 
propios correspondientes a AA satisfacen que A¡ > A2 >... > An. En- 
tonces, 


AU, - Ad, =(40,) Av, = 0(A*A0;) = 0lAy0; 


O A E 
=0 (0-0) == $ iZ (3.38) 
Luego, [Añ, AV2,... , AU) es un conjunto ortogonal. Sea r el número 


de valores singulares no nulos de A, esto es, r es el número de valores 
propios no nulos de 4* A. De la expresión (3.38), se tiene que A%, 4 O si y 
solo si 1 < 1 < r. Entonces, LAv,, AV... , AU, ) son vectores linealmente 
independientes, los cuales claramente pertenecen al espacio columna de 
A [Col(A)]. Además, para cualquier y € Col(A) —digamos, y = AY— se 
puede escribir 7 = C1U1 + C2U3 +... + CpUn, y 


y = AZ =C¡AU +... Cy AU Cr+1A0r+1 +... + CnAUn 
=GA0,+...+cpA0,+0+...+0. 


Así que y está en el espacio generado por [ Av, ADa,... , AD), lo cual 
muestra que L Av, AV2,... , Av, ) es una base (ortogonal) para Col(A). 
Por lo tanto, el p(4) =r. Mm 


3.6.1 Descomposición en valores singulares 


La descomposición de A involucra una matriz “diagonal” S de tamaño 
m Xx n particionada como sigue 


Drxr : Orxn1 01... 0 
S= ee . co. con Die =l| £ *. 2 | (839) 


Om: xr : Om xn 
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donde mi =M-—", Ni =N—P, 0, para 1 = 1,2,...,r son los valores 
singulares no nulos de A y r = p(A). (Si r es igual a m o n, entonces 
algunas o todas las matrices nulas desaparecen). 


Teorema 3.33 Descomposición en valores singulares 
Sea A una matriz realde tamaño m xn con rango r. Entonces, existen 
matrices ortogonales U y V de tamaño m x m y n xn, respectivamente, 


tales que 


A=USV', (3.40) 


donde S tiene la forma dada en la expresión (3.39). 


Demostración. 

Sean A; y U, como en la prueba del Teorema 3.32. Entonces, 0; = 
VA = [145;]| > 0 para 1 << r, r = p(4) < mínfím,n), y el conjunto 
de vectores [ Av, AU2,... , AU, ) es una base ortogonal para Col(4). Si 
se normalizan cada uno de los vectores Av;, se puede definir 


_ 1 E 1. j 
U = AU, = —AU;, A 
45, 0; 
Luego, el conjunto de vectores (ú1,U2,...,U,) es una base ortonormal 
para Col (4); esta base se puede extender hasta obtenerse una base or- 
tonormal de R””: expresémosla por Lux, sos Us Ur dos Ud A partir 
de la definición de los vectores u;¿, se puede escribir 
o¡4u; para ¿=1,2,...,r 
Ad =4 0u4; para 21=r+1,r+2,.:., mM 


0 para 2¿=m+1,m>+2,...,n. 


En forma matricial se expresa de la siguiente manera 


AV =[40] ... AD, AUr+1 ... Aún Alm+1 ..- AU] 
A A A 
A A | 
= [a d, dm] | 2 E e | 
> 1 r r+1 m 0 0 0 0 
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Por lo tanto, 


Dexr : Orxn1 
A E A O O 


Om xr : Om xn1 


(3.41) 


Nótese que las columnas de la matriz ortogonal V (de tamaño n x n) son 
los vectores propios ortonormalizados de la matriz 4* A. Por otra parte, 
las columnas de la matriz ortogonal U (de tamaño mx m) son los vectores 
propios ortonormalizados de la matriz A4* y la matriz S está definida 
como en (3.39). Si se multiplica por el lado derecho de la ecuación (3.41) 
por V7! (V=1 = V?), se tiene que 


A=USV?. 


Esto finaliza la demostración del teorema. E 


Ejemplo 3.23 Encuentre la descomposición en valores singulares de la 


matriz dada en el Ejemplo 3.21. 


Solución. 

Del Ejemplo 3.21 se tiene que los valores singulares asociados a la 
matriz A son 0 = 16, 03 = 12 y 03 = 3. Al calcular los respectivos 
vectores propios ortonormalizados de 4*A, se obtiene: 

1 1 1 

za E 1 e 


1 
vwX=>=-3=|1|, v=-=|- UV == 
ala a IN e AO 


Por otra parte, la matriz 44? es 


14 2 0 
AM=|2 14 0 
0.03 


y sus respectivos vectores propios ortonormalizados son 
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0 0 
Finalmente, si U = [ú¡ ús dz), V = [01 02 03] y S=| 0 243 0 |, 


entonces 
3v2 -5v2 0 4.0 0 42 3v2 0 
A=| ¿v2 142 0 0 243 0 216 -¿v6 3v6 
0 0 1JLO0 0 vV3]l-5v3 3v3 3v3 
1.3 2 
=| Bl 2 
1.1 1 


Ejemplo 3.24 Encuentre la descomposición en valores singulares de la 


matriz dada en el Ejemplo 3.22. 


Solución. 

Haciendo referencia al Ejemplo 3.22, se tiene que los valores singulares 
asociados a la matriz A son oí = 14 y 0% = 3. Al calcular los respectivos 
vectores propios ortonormalizados de 4.4%, se obtiene: 


“lo [0 


son 


s10= (m0) V=(50%.0%)ys=[%* Y O o Cntonces 
E 

a=[10][via 0 07 4 4 Y 1.3 2 

[01 0 v3.0 VA Ya VB | |1 1 1 
14  Y3 y32 
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3.6.2 Descomposición polar 


Una consecuencia interesante y útil de la descomposición en valores sin- 
gulares para una matriz cuadrada A es la descomposición polar de A. 
Teorema 3.34 Descomposición polar a izquierda 

Sea A una matriz real de tamaño n x n con rango r. Entonces, existe 
una matriz simétrica P de tamaño n xn con valores propios no negativos 


y una matriz ortogonal (Y de tamaño n x n tales que 


A=PQ. (3.42) 


Demostración. 

Si A es una matriz real de tamaño n x n, en una descomposición de 
valores singulares las matrices U, S y V son también de tamaño n x n. 
En este caso, se puede escribir la ecuación (3.40) como 


A=USV*=0OSU (IV =(0SUnNUV*=PO, 
la matriz P es siempre única, aun cuando Á sea singular, y está dada por 
P= |[A44!]? =USU'; 


nótese que esta matriz es simétrica y Q = UV? es una matriz ortogonal. 
Se deja como ejercicio la comprobación de que P tiene valores propios no 
negativos. Mi 


Corolario 3.34.1 Descomposición polar a derecha 
Sea A una matriz compleja de tamaño n x n con rango r. Entonces, 
existe una matriz simétrica P! de tamaño n x n con valores propios no 


negativos y una matriz ortogonal Q de tamaño n x n tales que 


A=QP". (3.43) 
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Demostración. 


En términos de la descomposición en valores singulares de A, es decir, 
A =USV?, se tiene que 


P = [44]? =V8vV* y Q =UV*. 
Si A es no singular, entonces la matriz Q está dada por 
Q=A[P"”. 
El lector puede verificar que P” tiene valores propios no negativos y Q es 
ortogonal. mm 
Ejemplo 3.25 Encuentre la descomposición polar tanto a izquierda co- 
mo a derecha para la matriz dada en el Ejemplo 3.21. 


Solución. 


En el Ejemplo 3.23, se obtuvo la descomposición de A en valores 
singulares mediante las matrices U, S y V: 


E 4.0 0 
U==|1 1 01|, S=|0 243 0 
2lo 0 ya 0. 0 y3 


Si se definen 


ale LE 0 4.0 0 1.10 
P=u8* = (3) IN 0 243 0 1.10 
22 loo v2]lo o y3]|o.o0 y2 


2443 B=x33 U 
2432 Dia 
v3 
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simplificando 


Y vV3-=1 yY3+1 2 
=$ V3+1 yY3-1 2 |, 
-2 2 2 


entonces la descomposición polar a izquierda queda 


Y 2443 2 938 yal yl 3 


A A val y3-1 2 
0 0 V3 2 2 2 
SY 
=|31 2 
+ 4 


Para determinar la descomposición polar a derecha, se establece 


12 [| v3 1 -v2 40 0 V3 vV3 0 
P= (3) vV3 -1 y2 0 243 0 tot 2 
0 2 y2 0 0 yY3]|-v2 y2 y2 
123492 24/3=9% 1 
-Y3 243-2 243+2 1|, 
1 Él 5 


luego la descomposición polar a derecha queda 


y val 4341 3 20/3432 2/3=3 1 
> vabi 3=1 2 WE DI el 
D 2 2 1 a] 5 

1.3 
=|31 2 
1141 1 


Ejercicios 3.4 


1. Para cada una de las matrices dadas a continuación: 


11 4 Ll 3 a —b 
a. Dd, . 6 Ñ a,bER. 


131 3 -1 b a 
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1] 3 
tod 
d el 311. Pla 
E YA 
2 9 4 5 


i) Encuentre una descomposición en valores singulares. 


1i) Determine la descomposición polar tanto a izquierda como a 


derecha . 


2. Si A es una matriz real de tamaño nx n con valores singulares todos 


iguales a 1, muestre que Á es ortogonal. 


3. Si A es una matriz real de tamaño n Xx n, ¿cuál es el producto de 


sus valores singulares 01 :02*...* 0p? 


4. Si A es una matriz real de tamaño 2 x 2 y U € R? es unitario, 


muestre que 
02 < [Au] < 0, 
donde 01,02 son los valores singulares de A. 
5. Si A es una matriz real de tamaño m x n y YE R”, muestre que 
Sp lv]| < 40] < 0111711, 


donde 01,0, son los valores singulares más grande y más pequeño 


de la matriz A, respectivamente. 


Capítulo 4 


Matrices complejas 


En la Sección 2.3 se consideraron matrices de componentes reales, en las 
cuales los valores propios y vectores propios eran complejos. En este capí- 
tulo se desarrollará la teoría correspondiente a valores propios y vectores 
propios para matrices de componentes complejas. El objetivo principal 
es estudiar algunas factorizaciones para este tipo de matrices, de manera 
análoga a como vimos en el Capítulo 3. 


4.1 Clases especiales de matrices complejas 


Los tipos especiales de matrices cuadradas complejas que se analizan a 
continuación son las hermitianas, antihermitianas y unitarias, por tener 
características particulares y por ser muy útiles en ingeniería, y en especial 
en física atómica. Estas matrices generalizan las tres clases de matrices 
reales especiales: simétricas, antisimétricas y ortogonales. 


4.1.1 Matrices hermitianas 


Recordemos que una matriz simétrica A = [a¡¿] con componentes reales es 
una matriz que tiene la propiedad de que A = A*. Las matrices hermitia- 
nas (o hermíticas) son las análogas para el caso en el cual las componentes 
de la matriz son números complejos. 
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Definición 4.1 Matriz hermitiana 


Se dice que una matriz A de tamaño n x n es hermitiana si 
A=A?*. (4.1) 


Ejemplo 4.1 Sea A la matriz de componentes complejas 


3 4— 51 342 | 


A=| 4+5 1 7 +61 
NE Tot 3 


Comprobar que A es una matriz hermitiana. 


Solución. 
3 1-5 3+2% 3  4+5i 3-21 
A=|lej 1 Timl=-la=h 1 726 
3=m T=o 2 342% 7466 2 
3 di BA 
AR =SA =l ld 1 T7itil=A 


3-2 7-6 2 
Nótese que los elementos de la diagonal principal de una matriz hermi- 
tiana son números reales, ya que tienen que coincidir con sus conjugados. 
Teorema 4.1 Sea A una matriz hermitiana, entonces para todos los vec- 
tores 7 € CP, ZRAZ es real. 


Demostración. 
La demostración consiste en un cálculo directo 


(Pan? =P A (207 =P Az, 


pero como 1% AF es una matriz hermitiana de tamaño 1 x 1, se concluye 
que es un número real. m 


Teorema 4.2 Si A es una matriz hermitiana, entonces sus valores pro- 


pios son reales. 
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Demostración. 
Supongamos que A es un valor propio y que Y es un vector propio 
correspondiente. Es decir, 


Az = AZ. 


Si se premultiplica por ¿4 


, se obtiene 

2 AR= PE. 
Pero por el Teorema 4.1, el lado izquierdo es real y la expresión del lado 
derecho 247 = |7|? 4 0. Se concluye que A debe ser real. Mm 


Teorema 4.3 Sea A una matriz hermitiana de tamaño n xn. Entonces, 
los vectores propios correspondientes a valores propios distintos de A son 


ortogonales. 


Demostración. 
Sean U, y Ua2 vectores propios asociados a valores propios distintos, 
digamos, A1 y A2. Es decir, 


AV = A1U1 y AU = A2U92 
VA Av =M0P 0, y 04 Av, = AU Da. 
Al tomar la transpuesta conjugada de la primera expresión, se tiene 
>.H 12 >H>yH 
(7, AV; = (117 v1) 


ve Av, = Mo 0. 


A 


En la última expresión se usaron los hechos de que 4% = A y Az es real. 
Luego, se tiene que 


20% 09 = 07D). 


Por lo tanto, 0N — »2) 01 02 = 0. Pero A1 — A2 H 0, así que vi oa = 0. 
Esto es, U1 y Ya son ortogonales. Ml 


Teorema 4.4 Sea A = [a;¿] una matriz con componentes complejas de 


tamaño n X n, entonces: 
tr(44*) =0 si y solo si A =0, (4.2) 


En realidad, tr(44%) >0s AJO. 
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Demostración. 
Si A = [a¡;], entonces A% = [b;;]), en donde b¿ = aj; Si se define 
C = AAY, se tiene 


Cik = 011% + Qj2bax +... + Uindnk 


n n 
> aijDjk = > Qijlkj. 


j=1 j=1 


En particular, las componentes de la diagonal de C' están dadas por 
n n 
— 2 
Ci = y QijQij = > las] 
j=1 j=1 
Por lo tanto, 
n n n 
2 
tr(C) = y Cii = y (E la] ) 
2=1 1=1.39=1 

Como lajj |” > 0, la única forma de que esta suma sea cero es que cada 
aj¿ = 0 para todo 1 y j. Esto significa que A=0. MN 
Teorema 4.5 Dada una matriz compleja cualquiera A de tamaño n Xx n, 
la matriz H = 3(A + A4) es hermitiana. 
Demostración. 

Queda como ejercicio para el lector. M 
Definición 4.2 Matriz de proyección espectral compleja 

Sea A una matriz compleja de tamaño nx n que no tiene valores pro- 
pios múltiples y sean Uj, Wi los vectores propios a derecha e izquierda de 
A, es decir, los vectores propios de A y A* asociados a los valores pro- 
pios Ay y Ay, respectivamente; se define la matriz de proyección espectral 


compleja correspondiente para cada Aj como: 
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Teorema 4.6 Sea A una matriz compleja de tamaño n X n que no tiene 
valores propios múltiples, entonces los vectores propios a derecha e 1z- 


guierda asociados a valores propios distintos de A son ortogonales. 


Demostración. 

Sean Y, y wj, los vectores propios a derecha e izquierda asociados a 
valores propios distintos A; y Aj, respectivamente. Para comprobar que 
v; - W¿ = 0, se calcula 


= (44 3)", puesto que 4, es un vector propio de Ar 


wP Ao, = Wu? (45;) reagrupando términos 


$] 2 

A > > Ñ A . 

= ww; Oj 4) ya que Y; es un vector propio de A 
=H> > > 

= Ay ñ == A (107 +0): 


Luego, Aj > Ai); - 1 =0, y como A¿ — A; 4 0, entonces %; : 0, =0. M 


Teorema 4.7 Sea A una matriz compleja de tamaño n x n con valo- 
res propios distintos A1,A2,..., An, entonces las matrices de proyección 
espectral E(A;) definidas en (4.3) satisfacen las siguientes propiedades: 
a E(M)E(Oy) = DA) dó=a b) S EM) = Ln, 
0) siiAj. k=1 
c) Cada E(A;) conmuta con A, es decir, AE(Az) = E(A¿) 4. 


Demostración. 


a) Sean 0, y w, los vectores propios a derecha e izquierda asociados 
a valores propios distintos A; y Aj, respectivamente; por el Teore- 
ma 4.6 estos vectores son ortogonales. Por lo tanto, de la definición 
de E(A;) dada en (4.3), se tiene 


> 2H 27H > -H 
UU UG; % us W;j 
E(A¡)E(Ay) = Hz MB TOBA VS gs O, 
O Oj WU; wi U, 
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y de manera análoga 


O z SH: ¿pl 
UGWi* UU; > W¿ 0 w; 
EAS) == E RRE tn 17 = EQ 
Qi)E(s) Ea, als, Ea, ww. 0 0%) 


b) Queda como ejercicio para el lector. 


c) Al premultiplicar por A cualquier matriz E(Ar), se obtiene 


> WE UE Wy, 


y al multiplicar por A cualquier matriz E(Ax), se llega a 


CV pq Ho O ps Ho 
E(A¿) A = a (AP) ” = Ta (Ayu) =ArE(Ar). (4.5) 


Luego, AE(A;) = E(A,) 4 para k=1,2,...,n. Ml 


Ejemplo 4.2 Encuentre las proyecciones espectrales de la matriz: 
1-3 2 —2 — 21 
A= 1-34 2 1+2 
a+ 1-2 24+3 


Solución. 
La ecuación característica asociada a la matriz A es 


pA(A) = -A +5 84 +6 =-—(A-— 3) (44 - 24 +2) =0, 


entonces se tiene que los valores propios asociados a la matriz A son 
A =3, A2=1+1y Az = 1-1, y los respectivos vectores propios de A 
son 


0 -1 1 
Y =|l+:3|, v = [1-24 y v= |1 
1 dl 0 


Los vectores de 4% asociados a A1, A2, Ag son 


wi == 1 . wa = —1 y W3 = —1 
al 1423 144 
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Luego, las matrices de proyección espectral E(Az) son 


¿0 0 0 0 
EA) =3 |1+4| (4 1 -1]=| -1-4 1-4 -1+¿|, 
e 1. i 
-1 1. 4 -1+ 
EQ) = |1-i| [1 ¿4 1-4 =| 1-4 1+4 -2 
1 1 io 1-¿ 
ji 2 4 1-1: 
E(As) = |i| [2 ¿+ 1-¿=| 2% -1 1+: 
0.0.0 


Nótese que E(A1) + E(A2) + E(A3) = La. 


4.1.2 Matrices antihermitianas 


Como se ha visto, una matriz antisimétrica A es una matriz real que tiene 
la propiedad de que 4? = —A. Las matrices antihermitianas constituyen 
el análogo para el caso complejo. 


Definición 4.3 Matriz antihermitiana 


Se dice que una matriz A de tamaño n x n es antihermitiana st: 


AF =-—A. (4.6) 
Los elementos de la diagonal principal de una matriz antihermitiana son 


cero o imaginarios puros, ya que tienen que coincidir con sus conjugados. 


Teorema 4.8 Si A es antihermitiana, entonces para todos los vectores 


complejos Z, ZA.,AZ, es cero o imaginario puro!. 


Demostración. 
La demostración consiste en un cálculo directo 


GRAD? = 2 AR (2D =-—¿2P Az. 


1 Un imaginario puro es un número complejo de la forma ai con or real. 
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Si se expresa ZYAZ = a +18, entonces la ecuación anterior se puede 
escribir como 


a—-if=-(a +18), 


luego se debe tener que a+ = —a,, así que a. = 0. Por lo tanto, se concluye 
que 2% AZ es un imaginario puro. M 


Teorema 4.9 Los valores propios de una matriz antihermitiana deben 
ser cero o 1maginarios puros. 


Demostración. 
Supongamos que A es un valor propio y que Z es el vector propio 
correspondiente. Es decir, 


Si se premultiplica por 2%, se obtiene 


2 A2=MEzZ. 


Pero por el Teorema 4.8, el lado izquierdo es cero o imaginario puro y el 
lado derecho 242 = |]? es real y distinto de cero. Por lo tanto, 


2H AZ 


d= => 
ZHz? 


luego A debe ser cero o imaginario puro. Ml 


Teorema 4.10 Sea A una matriz antihermitiana de tamaño n x n. En- 
tonces los vectores propios asociados con valores propios distintos de A 
son ortogonales. 


Demostración. 
Sean 11 y U2 vectores propios de A que corresponden a valores propios 
distintos, digamos, A1 y A2. Para probar que U1 - Ya = 0, se calcula 


a >qóH> >qH> > . 
A1U1 : Va = (1151) Va = (Av) Va puesto que %1 es un vector propio 
= (54 44) 5, = —¿P (Ava) puesto que A es antihermitiana 
=- vn (1202) puesto que vz es un vector propio 


=-— AU da = —AgU, - Un. 
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Por lo tanto, se tiene que Or + A2)Ú1 - Ya = 0. Pero como A; =—A1 por 
ser imaginario puro, entonces A + A2 4 0, así que 01 - UV =0. M 
Teorema 4.11 Si A es hermitiana, entonces B =1¡A es antihermitiana. 
Análogamente, si B es una matriz antihermitiana, entonces la matriz 
A=iB es hermitiana. 


Demostración. 
Sea A% = A y definamos B = ¡A, entonces 


BH = (¡Ay% = (8% 44 = (-0(4) = —B. 


Esto prueba que B es antihermitiana. De la misma manera, se puede 
probar que A =¿B es hermitiana cuando B es antihermitiana. Ml 


Teorema 4.12 Dada una matriz compleja cualquiera A de tamaño n xn, 


la matriz S = 3(A = AR) es antihermitiana. 


Demostración. 
Queda como ejercicio para el lector. M 


4.1.3 Matrices unitarias 


Recordemos que una matriz ortogonal A es una matriz real que tiene la 
propiedad de que 4? = 47?. Las matrices unitarias son el análogo para 
el caso complejo. 


Definición 4.4 Matriz unitaria 
Una matriz cuadrada U de componentes complejas se dice que es una 
matriz unitaria si UY = I. En consecuencia, U es no singular y se 


tiene UT! = YH, 


Teorema 4.13 Sea U una matriz unitaria, entonces sus valores propios 


son de módulo igual a 1. 
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Demostración. 
Sea Á un valor propio de U' con vector propio asociado Y, es decir 


Ud = 0. (4.7) 


Luego, tomando la transpuesta conjugada, se tiene 


vi yl=10?, (4.8) 


Si se multiplica por la derecha ambos lados de (4.8) por UT, se obtiene 


ve UU) =1 04 (UD) 
“H(UID) =1 0% (45) por (4.7) 
vis =1A 0% 


Pero como 447 4 0, se concluye que A A = 1. Es decir, [|A[]? = 1, así que 
NJ]=1. 2 

Teorema 4.14 Si U es una matriz unitaria de tamaño n x n. Enton- 
ces los vectores propios asociados con valores propios distintos de U son 


ortogonales. 


Demostración. 
Sean U1 y Ya vectores propios de U que corresponden a valores propios 
distintos, digamos, Az y A2. Para demostrar que U; - Ya = 0, se calcula 


U a)" (U 02) = Oy 00 02) puesto que A¡,A2 son valores propios 
(07 ae] (Uv) = A vo Ua puesto que U es unitaria 
ve de =21 Ao 04 02. 


Por lo tanto, (1 A2)Ú1 - va = 0. Pero como A; es distinto de Az, 
entonces Aj Az % 1, así que 0, :V¿=0. M 
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4.1.4 Matrices normales 


Definición 4.5 Matriz normal 
Se dice que la matriz de componentes complejas N de tamaño n x n 


es normal si conmuta con NY, es decir: 
NW" =NEN, 


Ejemplo 4.3 Comprobar que las matrices complejas diagonales son nor- 
males. 


Solución. 
Sea D la siguiente matriz diagonal de tamaño n x n 


D=diagíM,A2,..., An), 
entonces 


DD* = diag[M,A,...,AnjdiaglD1, A, -.., Any 
= diag[|A11P,|A21?, ...,1An]% 
= diagíA1, Az, e ¡An jdiagí A, A2,... al 
=DYD, 


por lo tanto D es una matriz normal. 


Teorema 4.15 Las matrices hermitianas, las antihermitianas y las uni- 


tarias son matrices normales. 


Demostración. 
Supongamos que Á es hermitiana, entonces 


APTA =AA= 4? y AA =A4L=A?. 
Luego, A4A% = AFA. 
Las demás quedan como ejercicio para el lector. MM 
Teorema 4.16 Dadas A y B matrices complejas de tamaño n X N, si 


AB = BA entonces A y B tienen un vector propio en común. 
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Demostración. 
La prueba es análoga a la del Teorema 3.8 y queda como ejercicio 
para el lector. M 


4.2 Factorizaciones 


En esta sección se explica cómo se puede expresar una matriz A de com- 
ponentes complejas como el producto de dos o más matrices. 
Definición 4.6 Matrices complejas semejantes 

Una matriz de componentes complejas A de tamaño nxn es semejante 
a una matriz de componentes complejas B de tamaño n xn si existe una 


matriz de componentes complejas no singular P de tamaño n x n tal que 
B=PAP. (4.9) 


De manera análoga, se dice que A y B son semejantes si y solo si existe 


una matriz de componentes complejas no singular P tal que 
PB = AP. (4.10) 


Teorema 4.17 Las matrices complejas semejantes tienen el mismo po- 
linomio característico y, por tanto, los mismos valores propios. 


Demostración. 
Como A y B son matrices complejas semejantes de tamaño n Xx n, 
B = PAP, entonces 


B-M=PAP-APP=PT|AP-AP] =P |A-—AI]P. 
Por consiguiente, 


det(B—AI) = det[P"*(A— AI)P] = det(P”*) det(A — AL) det(P) 
= det(P”?*) det(P) det(A — AL) = det(A —AJ). 
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Esto significa que A y B tienen la misma ecuación característica, y como 
los valores propios son raíces de la ecuación característica, tienen los 
mismos valores propios. M 
Definición 4.7 Matrices congruentes hermitianas 

Dos matrices hermitianas A y B de tamaño n x n son congruentes 
hermitianas si existe una matriz P no singular de componentes complejas 


de tamaño n Xx n tal que 


A=PYBP. (4.11) 


Teorema 4.18 Descomposición de Sylvester 
Sea A una matriz compleja de tamaño n X nm con valores propios dis- 


tintos A1,A2,..., An, entonces A se puede escribir como 


A = Y ARE(Az), (4.12) 
k=1 


donde la matriz E(A) es dada en (4.3). 


Demostración. 
Puesto que cada E(A;) conmuta con A, al sumar las expresiones ob- 
tenidas en (4.4) y (4.5), se tiene 


Y AE(A1) = y E(A;)4 = > ME(Ar) 


Y E(Ax) | A= Ss ME) 


k=1 k=1 


y usando la propiedad b) del Teorema 4.7, se completa la prueba. MM 


Ejemplo 4.4 Encuentre la descomposición de Sylvester para la matriz 


dada en el Ejemplo 4.2. 
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Solución. 

En el Ejemplo 4.2, se obtuvo que los valores propios asociados a la 
matriz A eran A1 =3, A2=1+1, Az =1—1, y las matrices complejas 
de proyección espectral E(A;) fueron 


0 0 0 1. 4 -1+ 
E(A4)=| -1-4 1-4 -14+¿|, EQ2)=| 1-4 1+4 -2 
1. i 1 io 1-4 
2 4 1-4 
E(A)=| 2 -1 1+i|, 
0.0 0 
luego 
3 
Y AE(A) =3E(%) + (1+1)E(A3) (1 —1)E(%), 
¿i=1 


la cual coincide con la matriz A. 


Teorema 4.19 Teorema de Schur 
Sea A una matriz compleja de tamaño n xn. Entonces A es semejante 
a una matriz triangular superior T', mediante una matriz unitaria U, es 


decir 
T =UY AD. 


Entonces, se dice que Á es triangularizable por una matriz unitaria U. 


Demostración. 

La demostración es por inducción sobre n. Si n= 1, A es una matriz 
de tamaño 1 x 1 que es triangular. La matriz unitaria es U = [1]. 

Supongamos que toda matriz de componentes complejas de tamaño 
(n o 1) x (n e 1) es triangularizable por una matriz unitaria. Sea A una 
matriz de tamaño n x n. Sabemos que su polinomio característico tiene al 
menos una raíz compleja A1. Sea Y, € C” un vector propio normalizado 
asociado al valor propio A¡. Denotemos por W el complemento ortogonal 
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a U1 de dimensión n— 1. Sea [ 02, UB... Ni una base ortonormal de W. 


Luego, cada vector X de W tiene la forma 
X=as Ua +43 U3 +... + An Un- 


La matriz de cambio de base, de la base canónica de C” a la base 
(01, Va)... ej es la matriz S cuyas columnas son los elementos de los 
vectores 0. Luego, 


AS =|[ AU AU ... AU, ] 
= [M0 AU ... AU]. 
Por lo tanto, 
SASs=S"*[| 10, AU ... AU]. 


Pero como S es unitaria, se tiene que S7! = S%, Por consiguiente 


A 219 ¿. A 
) 


| 


donde 21; = UH AD, y A; es una matriz de tamaño (n Ss 1) x (n - 1). 


SHAS = 


La prueba se completa por inducción, sea R¡ una matriz unitaria de 
tamaño (n— 1) x (n— 1) tal que (R¡)9% 41R; = T,, con T; triangular 
superior por la hipótesis de inducción. Entonces, la matriz 


1 U- zo 0 
E 0 

= | A | 
es unitaria y 


(SR)FA(SR) =RU(STAS)R 


capa 7 227 0 
lo RE||O AF||O Ri 
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donde 2% = [22 213 ... Zim]. La matriz SR = U es el producto de 
dos matrices unitarias; por lo tanto, es también una matriz unitaria. Así, 
U* AU es una matriz triangular superior y nuestra prueba queda com- 
pleta. E 


El siguiente resultado corresponde a una consecuencia directa del teo- 
rema anterior. 
Teorema 4.20 Sea A una matriz de componentes complejas de tamaño 
n xn. Los valores propios de A son los elementos de la diagonal de la 


matriz triangular superior T' semejante a A por una matriz unitaria. 


Demostración. 
Como A y T' son semejantes por el Teorema 4.17, tienen el mismo 
polinomio característico. Por otra parte, como T' es triangular, se tiene 


PALA) = pr(A) = (ti = A) (tao = A) Di q = A), 


donde t11,t22,...,tnn son los elementos de la diagonal de T'. Así pues los 
valores propios de A son los elementos de la diagonal de T. Mm 


Ejemplo 4.5 Dada la matriz de componentes complejas: 


encuentre una matriz T' que sea la triangularización de A. 


Solución. 
El polinomio característico de A es 


PA(A) =-A +22 — (2+DA+ (1+2) =-(1- 6 AAA). 


Luego, los valores propios son A = 1, A2 = 1 y Az = 1—1¿. El vector 


0 
propio correspondiente a Ay =1 es % = |3+4|; para A2 = 1 es Y = 
0 
0 1-2 
—1-—31| y, por último, para Az =1-—1¿esv= | —5 


2 21 
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Para determinar U, se aplica el proceso de Gram-Schmidt a (5, U2, 
U3) para encontrar una base ortonormal para C*, puesto que el producto 
punto en complejos no es conmutativo, entonces hay que tener en cuenta 
el orden en que se realiza el producto punto. Luego, para determinar los 
vectores ortogonales, se usa la siguiente expresión: 


k-1 a k-1 H4> 
y, 7 (D,, vw; Uk > 
¿i=1 o 
y la base ortonormal se obtiene dividiendo cada 4 por su norma. Como 
mi 0 
Ú 
[81 ]] = 5, se hace ús = A =-= |3+4i| , los otros vectores serían 
vi 0 
S 5 dl 15 — 51 e 
Wo = 0 — (ul 02) 41 = A 3 3+4 
25 
0 
0 
= a — 31 1 : 3|=|0 
2 
0 
Entonces, [|1w52]] = 2 y da = |0| . Se puede verificar que 4 uz = 0. Ahora, 
ll 


dz = 03 — uo, — ul vga 


1-2 , 0 0 
15 + 20 
an 5 EE A 
21 0 1 
1-2 0 1-2 
=|-5|+|5|=]| 0 
21 —21 0 
1-2 
Por último, ||%3|| = V5, luego dz = + O |. También se verifica 


v5l 0 
que la base obtenida para C* es ortonormal observando que an uz=0y 
ú% úz = 0. Por lo tanto, la matriz unitaria U es 


0 0 (1-2)/v5 


U=| (3+41)/5 0 0 
0 1 0 
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y la matriz triangular es 


3 — 4í 
y o| =D y 


5 
UHAU = 0 0 il 124 3 +4; 
1+2 | o | | 
0 0 2 2 5 
5 0 
Al realizar los productos, se obtiene 
19 ¡ 2-14 
—i 
"EN 
Es 0 i ill 
v5 
0 0 1-3 


Nótese que los elementos de la diagonal principal de la matriz T' son los 


valores propios de la matriz 4. 


Teorema 4.21 Sea A una matriz hermítica de tamaño n X n, entonces 


existe una matriz unitaria U tal que 


U-"AU 


es una matriz diagonal. 


Demostración. 


Como A es una matriz compleja, por el teorema de Schur, A se puede 


triangularizar mediante una matriz unitaria U, es decir 
T=0* AD 


donde T' es una matriz triangular superior. 


Al tomar la transpuesta conjugada y usando que 4% = A, se tiene 


que 


TF = UTA” =0 PAR (UN? = UR AU =T, 


como T% es una matriz triangular inferior, luego T es una matriz diago- 
nal. En consecuencia, Á es semejante mediante una matriz unitaria U, a 


una matriz diagonal T. m 
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Teorema 4.22 Si A y B son matrices complejas de tamaño n xn y 
AB = BA, entonces A y B pueden ser triangularizadas unitariamente en 


forma simultánea. 


Demostración. 
La demostración es por inducción sobre n. Por el Teorema 4.16, existe 
v € C” normalizado tal que 


Av =A1U1 y BV, = 101. 


De manera análoga, como en la prueba del Teorema 4.19, se construye 
una matriz S unitaria cuya primera columna sea 1. Entonces 


M4 512 + Tin | mn Vr +0 Yin | 


0 
SsiAS = y SHBS = 
: Ar 


: B1 
0 0 


donde A; y B¡ son matrices complejas de tamaño (n e 1) x (n — 1). Por 
otra parte, 


(sFAs) ($*B8) = SP(AB)S puesto que SY = s7!, 
= 94 (BA)S puesto que AB = BA, 
= (SBS 15" AS). 


y por la multiplicación por bloques, se tiene 
Mar : AE + GP Br | Ma: pur yP Ay 
cu llas a ] 
donde 22 = [23 733 ... 1,9% =l2 Ya ... Yin] y, por lo tan- 


to, A¡B¡ = B14:. Los detalles para culminar la prueba son análogos a 
los del Teorema 4.19 y se dejan como ejercicio para el lector. M 


Teorema 4.23 Si A y B son matrices normales de tamaños n x n, en- 
tonces AB = BA si y solo si existe una matriz unitaria U de tamaño 


n xn tal que UY AU y UY BU sean ambas diagonales. 
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Demostración. 

Supongamos que AB = BA. Por el Teorema 4.22, existe una matriz 
unitaria U tal que UYAU y U* BU son ambas triangulares. Pero como 
A y B son normales, pueden ser diagonalizables unitariamente. De aquí 
que UY AU y UY BU sean diagonales. Por otra parte, si UY AU = Da y 
UY BU = Dz son ambas diagonales, entonces 

AB =(UDAUF) (UDgU*) =UDADgU* 
=UDgDpU* = (UDgU*) (UDAU*) 
= BA. 


Esto completa la demostración. MM 
Ejemplo 4.6 Considere la matriz de componentes complejas: 
| 1 — —1 | 
1. 0 —2 |- 
| -1 2 0 | 


Comprobar que es diagonalizable mediante una matriz unitaria. 


Solución. 
El polinomio característico de A es pa(A) = A(3— A)(2+ A). En este 
caso, los valores propios de A son A¡ = 3, A2 = —2 y Az =0. Los vectores 
1 0 2 
propios correspondientes son Y, = 1 |, Uv = 1| y 03 = |-il, 
—1 —i 1 
respectivamente. 
Para encontrar la matriz unitaria U, se ortonormaliza el conjunto 
sm 1 |] 
(51, 02,03). Como ||41 || = V3, se hace Uu1 = a =— | ¿|.Por otra 
[Al Ya |_y 
| ñ Po Y | 
parte, se tiene que [Wa ]| = YV2, entonces da = — | 1| . Por último, 


y2 


—4 
2 
—1| . Se puede verificar que la base 


1 
vo [7 


33] = V6 de manera que dz = 
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obtenida para C* es ortonormal observando que ú/%úa = 0, HF uz =0 y 


5 3 = 0. Por lo tanto, 
1/43 0 2/vV6 


U=| ¿/V3 1/v2 -:¿/v6 
1/43 -i/V2 1/6 


Como el det(U) = 1, se tiene que 


3.0.0 
D=UFHAU=|0 -2 0 
0.0.0 


Luego, la matriz A es diagonalizable por una matriz unitaria. 


Teorema 4.24 Descomposición espectral para hermitianas 


Sea A una matriz hermitiana de tamaño n x n con valores propios 


A1,A2,..., An, entonces A se puede escribir como 


A=> EQ), (4.13) 


¡U; pene 
E(A) = SES = UU . (4.14) 
U¿ Uj 
con Uy, U2,..., Un los vectores propios normalizados de A. 


Demostración. 
Por el Teorema 4.21, existe una matriz U tal que UT AU = T, donde 


T es una matriz diagonal. Entonces, 


A =UTU! =UTUF 


Az 0 uz 
7H 
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luego 
mal 
úl 


11 
An Un 


A=UYTUR" = [da da oa Ue] 


> >H > >H > >H 
= 418] +A2U2U) +... + AnUnU,, - 


Esto prueba el teorema. Ml 


Ejemplo 4.7 llustrar el teorema de descomposición espectral para la ma- 


triz dada en el Ejemplo 4.6. 


Solución. 

Del Ejemplo 4.6 se tiene que los valores propios asociados a la matriz 
A son A; = 3, A2 = -2 y Az = 0. Los respectivos vectores propios 
normalizados de A eran 


1 0 2 
dh = á 


| 
S|- 
[9] 
| 
E 
Sl 


Ll. :=4.-=1 0 0 1 — -—1 
= 1 1 3 |-]|0 0 (ES 1 O -—2 |, 
=L..- 9 1 0 —3 1 -1 2 0 


la cual coincide con la matriz A dada en el Ejemplo 4.6. 


Teorema 4.25 Sea A una matriz hermitiana y no singular que se puede 


factorizar como 
A=LDU 


sin intercambio de filas, donde L es una matriz unitaria triangular in- 
ferior, D es una matriz diagonal y U es una matriz unitaria triangular 


superior. Entonces, L= UY. 
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Demostración. 
Puesto que A puede factorizarse como A = LDU, tomando la trans- 
puesta conjugada, se tiene que 


AR = (LDU)" =U ADAL = UP DIA. 
Como A es hermítica, es igual a 4%, por lo tanto 
EDU =U*PDL? 
Der (UeDo oo” 
D=(uD*D(uLn”, 


luego L =U7!* = UY, lo cual completa la prueba. M 


Ejemplo 4.8 Determine la descomposición LDU para la matriz dada en 
el Ejemplo 4.6. 


Solución. 
De manera análoga al caso real, se realizan las respectivas operaciones 
por filas y se llega a 


L “=p :=1 1.0.0 1.000 1 — —1 
1. 0 —2|= 1 1.0 0 -1.0 o 1 1 ; 
-1 2% 0 =1 — 1 0.0.0 0. 0. 1 


nótese que L =U*. 


Teorema 4.26 Si N es una matriz normal, entonces la matriz T” = 
UYNU (U unitaria) es también normal. 


Demostración. 
Sea N una matriz normal y definamos T = UY NU. Multiplicando 
por T*, se obtiene que 
TTE =(UENU) (UPNU)* 
=UPEN(VUPIN*E=SUENNO 
=UENYNU puesto que NV es normal 
UNO DFN) =P0T. 


y como TT* = T*T, se ha demostrado que T' es normal. m 
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Teorema 4.27 Sea A una matriz de componentes complejas de tamaño 
n xn. La matriz A es normal si y solo si es diagonalizable mediante una 


matriz unitaria. 


Demostración. 
Supongamos que Á es normal. Por el teorema de Schur, la matriz A es 


semejante a una matriz triangular superior 7', por medio de una matriz 
unitaria U. Es decir T =U*Y AU. Pero como 


TT* =(u* av) (u* av)? 
=U*4 AA U =UPY AFAU 
=(U"APD) (D*AD)|= PR. 
la matriz 7' resulta ser normal. El lector puede verificar que la matriz T 
es diagonal. 
Recíprocamente, supóngase que A es diagonalizable por una matriz 


unitaria U, es decir UY AU = D, donde D es una matriz diagonal. Como 
D es normal (Ejemplo 4.3), se verifica que 


As =(uDU A) (upu tE)" 
=UDD*"U* =UDADE" 
= (UD MODOS 
= AFA. 


Por lo tanto, la matriz A es normal. Mm 


4.2.1 Forma canónica de Jordan 


Si A es una matriz real de tamaño n x n, en la Sección 3.4 se vio que se 
podía encontrar una matriz no singular P de tamaño n x n tal que 


J=PAP. 


En esta sección se explica, para matrices de componentes complejas, la 
forma canónica de Jordan. 
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Teorema 4.28 Sea A una matriz compleja de tamaño n x n. Entonces, 


existe una matriz P no singular tal que 
Te Oy) duda 0 
PAP = e : =Í, (4.15) 
A 


en donde cada Jn,(A;) es un bloque de Jordan de tamaño n; X Ni Y 
ni +n2 +... + ng =N. Los valores propios A;, 1 =1,2,...,k no son 
necesariamente distintos. El número total de bloques quedan determinados 


unívocamente por la matriz A. 


Demostración. 
Queda como ejercicio para el lector. M 


Ejemplo 4.9 Encuentre una matriz no singular P tal que PAP sea 


una matriz de Jordan, para la siguiente matriz: 


2+1 1 0 


Solución. 
La ecuación característica de A es 


1 + (3 +31)? — 614 — (2— 24) =0. 


Luego, A= 1+1 es el único valor propio (de multiplicidad algebraica 
tres). Entonces, 


1 
(A-AD0=[4-(14+0)]0=| -2 - 
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Esto conduce a que z + y =0y — +2 = 0. Tomando x € IR, se 
1 

obtiene el vector propio: U, = - . Para encontrar un vector propio 
1 


generalizado, Ya se calcula 


1 1.0 T 
-2 -1 1 u| = |-1 
1 1.0 Z 
Si se realizan operaciones por filas, se obtiene el vector propio genera- 
0 
lizado: va = |1| , y de manera análoga, el vector propio generalizado: 
0 
0 
vz = |0| . Por consiguiente, 
1 
1.000 1.0.0 
P=|-110 y Ppr=l| 110 
1.0 1 -1.0 1 


Al efectuar el producto P7!AP, se llega a 


1.050 241 1 0 1.000 1+:3 1 0 
1.1.0 =2 1 1 -1 10]|= 0 1+2 1 
-1 0 1 111 1+3 1.01 0 0. 1+23 


El lector puede notar que sobre la diagonal de la matriz de Jordan se 
encuentra el valor propio de la matriz A. 


4.2.2 Descomposición en valores singulares 


Si A es una matriz real de tamaño m x n, hemos visto en la Sección 3.6 
que se pueden encontrar dos matrices ortogonales U y VW de tamaños 
mx om y nx on, respectivamente, tales que 


A=USV?. 


En esta sección se describe la descomposición en valores singulares y la 
descomposición polar para matrices de componentes complejas. 
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Teorema 4.29 Descomposición en valores singulares 

Sea A una matriz compleja de tamaño m x n con rango r. Entonces, 
existen matrices unitarias U y V de tamaño m x m y n Xx n, respectiva- 
mente, tales que 


A=USVY, (4.16) 


donde S es la matriz particionada de tamaño m Xx n, dada por 


Dr : Oeéni oa... 0 
0 ye , dónde: Des= | 2 “e, 3 MAT) 
Om, xr E Omixna1 A 
siendo gd, para i=1,2,...,r, los valores singulares no nulos de A. 
Demostración. 


Queda como ejercicio para el lector. M 


Ejemplo 4.10 Encuentre para la siguiente matriz de componentes com- 


plejas, 


1+23 1 


su descomposición en valores singulares. 


Solución. 
La matriz APA es 


li 2 1+14 0 6 31 
=4 1+3 2 1-i¿i| |3+3 3 ¡ 
En este caso, los valores propios de AY A son A¡ = 8 y A2 = 1. Por lo 


tanto, los valores singulares asociados a la matriz A son 0 =8 y 03= 1. 
Al calcular los respectivos vectores propios normalizados, se obtiene 


» 1 | Al 2 1 | 2 | 
Ú == VU === als 
27 V35 13+1 il 2 == /14 |-3-4 
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Por otra parte, la matriz AA% es 


1444 ícéá 27 _[ $ 14% 
des =i 144] | 1-3 6 


y sus respectivos vectores propios normalizados son 


= 1 [2442 Ñ 1 134 
Finalmente, si U = [da la), V = [Tr 02] y S= | O 
SVD de A es 


2 i 3-i —i 
ES AE OS al 
=| GF + 2 2 3H | E 
17) [vw vv] lla Íw a a 


; | , entonces la 


4.2.3 Descomposición polar 


Ahora se estudiará la descomposición polar para matrices de componentes 
complejas. El nombre de descomposición polar se debe a la representación 
polar de un número complejo z = pe'?. La analogía entre esta repre- 
sentación de los números complejos y la descomposición (3.42) de una 
matriz es debida a que los valores propios de la matriz P son números 
reales no negativos y los de la matriz (Q son números complejos unitarios. 


Teorema 4.30 Descomposición polar a izquierda 
Sea A una matriz compleja de tamaño n x n con rango r. Entonces, 


existe una matriz hermitiana P de tamaño n x n con valores propios no 


negativos y una matriz unitaria Q de tamaño n x n tales que 


A=PQ. (4.18) 


Demostración. 

Si A es una matriz de tamaño n x n, las matrices U, S y V de la 
descomposición en valores singulares son también de tamaño nxn. Luego, 
la ecuación (4.16) se puede escribir como 


A=USVY =Us(U*P*UyV* = (UsUByUV* = PQ. 
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La matriz P es siempre única, aun cuando A sea singular, y está dada 
por 


l 
Pa [AAR|E =US0%, 
Nótese que esta matriz es hermítica, ya que 
PE =(usut)y” =usHy* 
=USsUE =P (por ser S simétrica), 
y la matriz Q = UV? es unitaria, puesto que 
Q7 = (UV%)* = (vB y =yu! = qt. 
En la última ecuación se usaron los hechos de que U y V eran matrices 
unitarias. 
Se deja como ejercicio la comprobación de que P tiene valores propios 
no negativos. E 
Corolario 4.30.1 Descomposición polar a derecha 
Sea A una matriz compleja de tamaño n x n con rango r. Entonces, 
existe una matriz hermitiana P! de tamaño n x n con valores propios no 


negativos y una matriz unitaria Q de tamaño n x n tales que 


A =QP". (4.19) 


Demostración. 
En términos de la descomposición en valores singulares de 4, es decir 
A=USVY, se tiene que 


1 
P!=[AF A]? =Vvsv* y Q=0Ve, 
Si A es no singular, entonces la matriz Q está dada por 
Q=A[PJ 7. 


El lector puede verificar que P” tiene valores propios no negativos y Q es 
unitaria. MM 
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La descomposición de la conjugada compleja de A está dada por 
A=0QP. 
Esta descomposición siempre existe, y cuando la matriz A es no singular, 


entonces es única y la matriz P” tiene valores propios positivos. Por otra 
parte, 


det(A) = det(P”) det(Q) = per 
es la respectiva descomposición polar del determinante de A, ya que 
det(P”) =p = |det(4)] y det(Q) =e*. 


La descomposición polar a izquierda es también conocida como la des- 
composición polar inversa. Las descomposiciones polares a izquierda y a 
derecha están relacionadas por 


P =QP!IQP con Q =UV?. 


La matriz A es una matriz normal si y solo si P! = P. En este caso, QS = 
SQ, donde Q = VYU y por el Teorema 4.23, es posible diagonalizarlas 
mediante una matriz unitaria R, luego Q = RYAR, donde A es una 
matriz diagonal unitaria de fase e'?. Al tomar W = VR*, se puede 
volver a escribir la descomposición polar como 


A=(WAW*%) (wsw*), 
por lo tanto, A también tiene una descomposición espectral dada por 
A=WAWY, 
con valores propios complejos tales que AA? = 9? y una matriz unitaria 
W de vectores propios complejos. 
Ejemplo 4.11 Encuentre para la matriz dada en el Ejemplo 4.10 la des- 


composición polar tanto a izquierda como a derecha. 


Solución. 
La matriz P es 
uspH=? 4/2 +5 (2 +65) V2- 1- 31 


7 | (2-6)vV2-—1+3í 10y2 + 2 
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y la matriz Q unitaria es 


e 
_ (1-50v2+2%  (2-¿y2-1-3i|' 


7 
El lector puede verificar que A = PQ. Para determinar la descomposición 
polar a derecha, se establece 


2 
_ O E 1042 +2 
an - (5) re ic 


Luego, la descomposición polar a derecha queda A = QP". 


(6—-2)V2-3+i 
4/2 +5 li 


Las propiedades de las matrices complejas descritas en este capítu- 
lo son comparables a las propiedades de las matrices reales analizadas 
anteriormente. En el siguiente resumen se indica la correspondencia en- 
tre las matrices complejas unitarias y hermitianas con las matrices reales 
ortogonales y simétricas. 


Comparación entre matrices reales y matrices complejas 


Sea A = [a¡¿], con aj¿ ER. 

1. Toda matriz simétrica (A e 
A') tiene valores propios reales. 
2. Si A es una matriz simé-tri- 
ca, los vectores propios corres- 
pondientes a valores propios dis- 
tintos son ortogonales. 

3. Descomposición de Schur. 

Si A es una matriz de tamaño 
n x n con valores propios reales, 
existe una matriz ortogonal Q tal 
que 


QAQ =T 


es una matriz triangular superior. 
4. Teorema espectral. 

Si A = A!, existe una matriz or- 
togonal Q tal que 


QAQ=D 


es una matriz diagonal. 


Sea A = [a¡¿], con aj E C. 

1. Toda matriz hermitiana (A e 
AR ) tiene valores propios reales. 
2. Si Á es una matriz hermitia- 
na, los vectores propios corres- 
pondientes a valores propios dis- 
tintos son ortogonales. 

3. Descomposición de Schur. 

Si A es una matriz de tamaño n x 
n, existe una matriz unitaria U 
tal que 


PAST 
es una matriz triangular superior. 


4. Teorema espectral. 
Si A = A?*, existe una matriz 
unitaria U tal que 


UE AU =D. 


es una matriz diagonal. 
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5. Descomposición en valores 
singulares. 

Existen matrices ortogonales U y 
V de tamaños mx my nx nm, 
respectivamente, tales que 


A=USV?, 


donde S está dada por (3.39). 

6. Descomposición polar. 

Existe una matriz simétrica P de 
tamaño n xn con valores propios 
no negativos y una matriz orto- 
gonal Q de tamaño n x n tal que 


A=P0OQ. 


donde P=USU*yQ=UVWV 


5. Descomposición en valores 
singulares. 

Existen matrices unitarias U y V 
de tamaños m x m y n X n, res- 
pectivamente, tales que 


A=USVY, 


donde S está dada por (4.17). 

6. Descomposición polar. 

Existe una matriz hermitiana P 
de tamaño n x n con valores pro- 
pios no negativos y una matriz 
unitaria Q de tamaño n Xx n tal 
que 


A=PQ, 


donde P =USUF y Q =UVY. 


Ejercicios 4.1 


1. Determine para cada una de las siguientes matrices una matriz uni- 


taria U tal que U% AU sea diagonal: 


1d 1 2 +34 2 14 de 
a b. , Cc. 
y Y E 1 Lost. =P 
1 i 2+i| 1 13 2 
d.| — O E 6 | 1=3 4 23 
2=i li: 3 HN 2435 7 


2. Sea V = (A € Ma : aj¿ € C). Determine si cada uno de los siguien- 


tes subconjuntos HH son o no subespacios de V: 


a) H=(A€V : aj; =0). 
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b) H =(4 € V : a; son imaginarios purosp . 


e) H=(4EV:4=A4%). 


3. Sea H=xX< 4€ Ma: A= w,ZEC 
Z vw 


a) Demuestre que H es cerrado para la suma y la multiplicación. 

b) ¿Cuáles matrices en H son no singulares? 

c) Compruebe que si una matriz en H es no singular, entonces la 
inversa está en IH. 


d) Encuentre dos matrices A y B en H tal que ABX BA. 


4. Sea A una matriz de tamaño n x n con componentes complejas y 
sea Y € C” un vector propio correspondiente al valor propio A € C. 
Muestre que para cada escalar complejo no nulo a el vector a es 


un vector propio de A. 


5. Si A es una matriz normal, pruebe que A y 4* son diagonalizables 


por la misma matriz unitaria. 


6. Si A es una matriz normal, pruebe que A es un valor propio de 4 


si y solo si A es un valor propio de A?. 


Capítulo 5 


Formas bilineales 


En este capítulo estudiaremos las formas bilineales sobre espacios de di- 
mensión finita. Se introduce la representación matricial de una forma 
bilineal y se establece el isomorfismo entre el espacio de las formas y el 
espacio de las matrices de tamaño n X n. 


5.1 Formas bilineales 


Definición 5.1 Sean U, V y W espacios vectoriales reales. Una aplica- 
ción yg : Ux V = W se llama bilineal si satisface las siguientes propieda- 


des: 


BI 1. Para todo ú,, a € U y UE V, se tiene que 
g(ú1 + u2,0) = g(u1, 0) + g(u2, 0), 

y para todo u € U y U1,U2 EV, se tiene que 
A ON 


BI 2. Para todo «€ R,ue U y U EV, se tiene que 


> > > 


g(aú, 5) = ag(í, y) 0 g(ú, av) 
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Ejemplo 5.1 Sea g : IR" x R” —= R definida por 
AY) = AF, 


donde X € R”, Y € R” y A es una matriz real de tamaño m x n. 
Verifique si la aplicación y es bilineal. 


Solución. 
Para todo X¡, X2 € R'" y Y ER” se tiene que 


ga + X2,Y) =(X1 + XQ PAY = (Xi + X5AY 
= XAY + X3AY =g(X1, Y) + g(X2, Y). 
Para todo 4 € R, XeR” y Y ER” se tiene que 
g(aX,Y) =(aX AY = (aX) AY 
=aX AY =0g(X, Y). 


Así, la aplicación y es lineal cuando Y ER” permanece fijo. De manera 
análoga, se puede probar que g es una transformación lineal cuando la 
componente X € R” se mantiene fija. Por lo tanto, g es una aplicación 
bilineal. 


Teorema 5.1 Sea yg : R"” x RR” —= R una aplicación bilineal. Entonces 


existe una matriz única A de tamaño m x n, tal que 
g(X,Y) =ga(X, Y) SIC AF. (5.1) 


El conjunto de aplicaciones bilineales de R' x RY en IR es un espacio 


vectorial denotado por Bil(R” x R”,R), y la asociación 
Á > gA 


es un isomorfismo entre Bil(R'” x R”,R) y el espacio de las matrices 


reales de tamaño m Xx n. 
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Demostración. 
Sean €1,€2,...,€m los vectores unitarios estándar para R”” y sean 
U¡, Un, ..., Un los vectores unitarios estándar para R”. Luego, se puede 


expresar cualquier X er” y cualquier Y ER” de la siguiente manera 
m n 
X = Sat, y Y = Nas 
i=1 j=1 
Entonces, se tiene que 
m n 
g(X,Y) = (Y Titi, o) ms) y 
¿=1 j=1 


Como g es una transformación lineal, en la primera componente se llega 
a 


que 


Sea 


ai¡ = 9(€,,%;). 


que es precisamente la expresión del producto 
X*AF con A = la;;); 


esto prueba que y = ga para las a;¿ escogidas anteriormente. 
Ahora se demuestra que Á es única, para ello, suponga que g(X, Y) 0 
XtAY y que g(X, Y) = XtBY para todo X er” y Y ER”. Entonces, 


AY =XBY, 
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y al establecer CO” = A — B, se tiene que 
X'CY =0, para todo X ER” y Y ER”. 
En particular, si X= eY = u;, se tiene que 
0 = 8 Cd; = Ci. 

Así que ci¡¿ = O para todo 2, j, y por lo tanto C' = O es la matriz cero de 
tamaño m x n. Esto muestra que A = B. 

El lector puede probar como ejercicio la parte referente al isomorfismo 
entre el espacio de las matrices y las aplicaciones bilineales. Mm 


Definición 5.2 La matriz A en el Teorema 5.1 se llama representación 


matricial de la aplicación bilineal ga. 


Definición 5.3 Forma bilineal 
Si en la definición 5.1 se tiene que los espacios U = V y el espacio 
W =R de tal manera que g aplica a V x V en R, entonces se dice que y 


es una forma bilineal sobre V. 


Teorema 5.2 Sean gi, g2 : Vx V —= R dos formas bilineales distintas 


sobre V. Entonces: 
a) g1 + g2 es una forma bilineal. 


b) ag, es también una forma bilineal, donde a; € R. 
Demostración. 

Queda como ejercicio para el lector. M 
Definición 5.4 Rango de una forma bilineal 

El rango de una forma bilineal y sobre V, escrito p(g), se define como 
el rango de la matriz que representa a g. Se dice que g es degenerada o 


no degenerada según si p(g) < dim(V) o p(g) = dim(V). 
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Definición 5.5 Seag: Vx V —= R una forma bilineal sobre V. Entonces 


g es simétrica si para todo U, WE V, se cumple que 
g(u,u) = g(w, y). (635) 


Teorema 5.3 Una matriz real A de tamaño n x n representa una forma 


bilineal simétrica si y solo si es una matriz simétrica. 


Demostración. 

Supóngase que A es simétrica. Como para todo x > Y € R”, la matriz 
X'*AY es una matriz de 1 x 1, es decir, un elemento de R, entonces es 
igual a su propia transpuesta. Por lo tanto, 


X'AY =(X AY Y! =Y “AUX = Y YAX. 


Así que Á representa una forma bilineal simétrica. 
Recíprocamente, supóngase que A representa una forma bilineal si- 
métrica, es decir, 


ga(X, Y) =ga(Y, X) (5.4) 
para todo Xx. Y € R”. Como 
al? PAS (PAR == CAY. (65) 
si se comparan las expresiones (5.4) y (5.5), se tiene que 
(EP) = XP — RAY, (5.6) 
Como (5.6) se cumple para todo 6 Y € R”, se concluye que A = 4*. Es 


decir, Á es simétrica. MM 


Definición 5.6 Sea yg: Vx V —= RR una forma bilineal sobre V. Entonces 


g es alternada si para todo U, w E V, se cumple que 
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Definición 5.7 Inercia 
Sea A una matriz simétrica de tamaño n x n. La inercia de A es la 


terna ordenada de números: 
In(A) = (pos, neg, nul), (5.7) 


donde pos, neg y nul son los números de valores propios de A positivos, 
negativos y nulos, respectivamente (contando todas las multiplicidades al- 


gebraicas). 


Nótese que p(A) = pos + neg. 


Definición 5.8 Signatura 

A la diferencia entre el número de valores propios positivos y el 
número de valores propios negativos se le denomina signatura de la ma- 
triz A. En otras palabras, si In(A) = (i,7,k), se llama signatura de la 


matriz A a la cantidad: 
Sig(A) =i-j. 


Ejemplo 5.2 Determinar la inercia y signatura de la matriz dada en el 


Ejemplo 2.18. 


Solución. 
De los resultados del Ejemplo 2.18 se tiene que los valores propios de 
la matriz A eran A¡ = 1 de multiplicidad algebraica 2 y A2 = 7. Luego, 


In(A) = (3,0,0) y Sig(A) =3. 
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Ejercicios 5.1 


1. Asumiendo X* = (1, x9] y Y! = [y, ya], determine cuáles de las 
siguientes funciones g : R? x R? — R son aplicaciones bilineales: 
a. g(X, Y) = 411Y1 + 222y1 + 211Y2 + 1242. 
b. aX, Y) = 91141 — 1221 y2 — 122941 + 162249. 


C. g(X,Y) = 21y1 + 401y2 + 40241 + 163242. 


d. g(X,Y) = 21y1 + 20142 — 20941 + Loyo. 


e. aX, Y) = 11Y1 + 11Y2 + Tay1 + T2Y9. 


£. g(X,Y) = t1ya — Toy. 


2. Escriba cada una de las siguientes formas bilineales F" : R% => R en 


forma matricial: 


a. F(x, y, 2) = 6x? + 3y? — 22? + 127y — 18yz. 
b. F(x,y,z) = 73? + 7y? + 102? — 2xy — 4x2 + 4yz. 


c. F(x,y, 2) = 21? + 24? + 52? — 4xy + 2x2 — 2yz2. 
3. Sea V = Moa3. Para A, B € V, defina g : V x V — R como 
g(A, B) =tr(4'B). 
Demuestre que es una aplicación bilineal en Y x V. 
4. Sea V = Mm, demuestre que la función g : V x V — R dada por 
g(A, B) =ntr(AB) — tr(4)tr(B) 


es una aplicación bilineal en Y x V. 


238 5. Formas bilineales 


n n 
5. Sir = A Za Ti y Y= L da yi, represéntese la forma bilineal 
1= 


1! 
. 


en la forma XtAY, con A simétrica. ¿Cuál es el rango de 4? 


5.2 Formas cuadráticas 


Cuando se considera el cuadrado de la norma de un vector X € R”, se 
obtiene la expresión [|X |]? = X*X; tales sumas y expresiones en forma 
general se denominan formas cuadráticas. Ellas surgen frecuentemente en 
una gran variedad de aplicaciones. Por ejemplo, se pueden usar formas 
cuadráticas en ingeniería (para optimización), en economía (en el análisis 
de funciones de costo y utilidad), en física (para el estudio de energías 
cinéticas y potenciales) y en estadística (en el análisis de varianza). En 
esta sección se estudiarán algunos temas relacionados con estas formas, 
utilizando la teoría de las matrices simétricas analizada anteriormente. 


Definición 5.9 Sea V un espacio vectorial real de dimensión finita. Sea 
g: Vx V —= R una forma bilineal simétrica sobre V. Entonces, una forma 


cuadrática determinada por g es una función F : V —= R tal que 
F(5) = ga(6,U) =0Ar. (5.8) 
La matriz A es llamada matriz de la forma cuadrática. 


Ejemplo 5.3 Sean V =R” y F(U) = vi +v2+...+ 02. Escriba esta 


forma cuadrática como vt Av. 
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Solución. 
Usando la expresión (5.2) para m = n, se puede determinar la matriz 
A = [a;¿] asociada a la forma bilineal simétrica g, es decir, 


n n 
NA esti tiag 
F(u) = 0 Ay = ) ) Oi UjUje (5.9) 
i=1j=1 
En otras palabras, se quiere encontrar los valores de a;;, de manera que 
n n n 
a 2 
AjjUGUj = UG. 
2=1 j =1 t=l 


Como la matriz A es simétrica a; = aji, la forma cuadrática dada en (5.9) 
se puede expresar como sigue: 


n n n n=1 n 
2 
» » QjjUGUj = » Qajv +2 » ) QijUGUj» (5.10) 
¡=1j=1 SL ¿i=1j>i 


Si se comparan los términos, se establecen las siguientes relaciones: 


n n n-=1 n 
o 2 92 aa ==) 
OijVU = Vi y Oj UUj —= UY. 
v=i 4=1 i=1j>1% 


Pero como en la función f (7) no aparecen términos de la forma %;U;, 
entonces 


of losii=j, 
“iZ RX O sii4j. 
Luego, A = Í,, y, por lo tanto, F(5) se puede expresar como U *1,,0. 
Ejemplo 5.4 Sean V = R* y F(X) = 20 + 523 + 22% + dota + 


2113 + 4x223. Exprese esta forma cuadrática como XtAX. 


Solución. 
Utilizando el resultado obtenido en (5.10) para n = 3, se tiene que 


3 2 3 
XAX = y aja +2 y > OijLiLj. 


i=1 i=1j>:i 
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Si se desarrolla esta suma y se comparan los a; con los coeficientes de la 


> 


función F(X), se obtiene la matriz 
0 | 
A=|2 5 2|, 
122 
la cual permite expresar a F (X ) de la forma X*AX. 


n 
Ejemplo 5.5 Si zx = L > 2; represéntese la forma cuadrática 
¿=1 


n 


(n = Mis = > (x; - Ty 


¿=1 
en la forma X*AX, con A simétrica. ¿Cuál es el rango de A? 


Solución. 
Sea X* = (71, 12,..., Tp) el vector que representa las n-observaciones. 
Si en el Ejemplo 5.3 se reemplaza cada v; por 1; — T, se tiene que 


F(0) = Y (0; - 2) = 01,0; (5.11) 


3 || =X-1z, (5.12) 
2 


od Li li 


donde 1 es un vector columna de unos de tamaño nx 1. Luego, T se puede 
expresar como sigue: 


ER 


1 ls 
1=) 2,= EX. (5.13) 


1= 


Si se reemplaza (5.13) en (5.12), se obtiene 


> < il AR 
> E t = A t 
v=X-11X (da -11 yA. (5.14) 
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Al sustituir en (5.11), se tiene que 


e 2193] = [(6 220) Jm (0 22099 


Aquí se usó que 11 = n, denotando J,, = 11%, se llega finalmente a que 
e 1 a E 
(n—1)5%=X (1, Jn) % =X' (Ln Tn) X. (5.15) 
n 
Luego, la matriz asociada a la forma es 
A =L=Ja y p(A) =n—1. 
En este material, la matriz J,, siempre denotará la matriz con todos sus 
elementos iguales a uno de tamaño n x n, definida anteriormente. 
Definición 5.10 Forma polar de una forma cuadrática 
Dada F una forma cuadrática real, se puede obtener una forma bili- 


neal simétrica g de F' de acuerdo con la siguiente identidad llamada la 


forma polar de g: 
[F(ú +) —- F(u) — F(0)]. (5.16) 


Definición 5.11 Dos formas cuadráticas X AX Y Y BY se dice que son 
equivalentes si existe una matriz no singular P tal que B = PAP. Aún 
más, las formas son equivalentes ortogonalmente si P se puede escoger 
ortogonal, equivalente-real si P se puede escoger con elementos reales 
y equivalente-compleja, o simplemente equivalente, si P tiene elementos 


complejos. 
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Teorema 5.4 Dos formas cuadráticas HARE Y Y BY son equivalentes 
si y solo si las matrices simétricas A y B son congruentes. 


Demostración. 
Si en la forma cuadrática X*AX se hace el cambio de variable X = 
PY, donde P es una matriz no singular, se obtiene la forma 


X'AX =Y'PAPY =Y'BY. 
Recíprocamente, sean A = [a¡¿] y PAP = [b;¿], las dos matrices simétri- 


cas asociadas con las formas cuadráticas, donde P es una matriz real no 
singular, entonces 


n-=1 n n-=1 n 
Nu 42) Y. apt y > 42) SijviY;: 
i=1 i=1j>1i i=1 i=1j>1 


El cambio de variable X = PY cambia la primera forma cuadrática a la 
segunda. Ml 


Ejemplo 5.6 Muestre que las formas cuadráticas: 
F; (X) = xl + a + 81172 Y Fa(Y) = ye — 1443 + 2y1Yy2 


son equivalentes. 


Solución. 
Utilizando el resultado obtenido en (5.10), para n = 2, se tiene que 


LAY 2 2 
X"AX = 0111] + 099123 + 20191]29. 


Si se comparan los as¿ con los coeficientes de la función F¡(X), se obtiene 


la matriz 
1.4 
al, 3) 


la cual permite expresar a Fi (X ) de la forma X'AX. Para la forma 
cuadrática F(Y), se tiene la matriz 


1 1 
a=L y 
En el Ejemplo 2.8 se mostró que A y B eran congruentes. Por lo tanto, 
F¡(X) es equivalente a la forma cuadrática Fr(Y). 
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Teorema 5.5 Dos formas cuadráticas XAX Y Y “BY son equivalentes 
ortogonalmente si y solo si A y B tienen los mismos valores propios y 


estos ocurren con la misma multiplicidad. 


Demostración. 
Si A y B tienen valores propios A1,A2,...,An y D es una matriz dia- 
gonal con A1,A2,..., An como elementos de su diagonal, entonces existen 


matrices ortogonales P y Q tal que 
Q%AQ = PBP = D. 


Por consiguiente, B = (P*)*Q*AQ|P=! = (QP=5DA(QP=5), y como 
QP7! es ortogonal, YiBY es ortogonalmente equivalente a X AX. 

Recíprocamente, si las dos formas son ortogonalmente equivalentes, 
B es similar a A (porque P7! = P?), y A y B tienen los mismos valores 
propios con las mismas multiplicidades. Mm 


Ejercicios 5.2 


1. Exprese las siguientes formas cuadráticas de la forma XUAX : 


a. F(x,y,z) = 61? + 3y? — 22? + 12xy — 18yz. 
b. F(x,y,z) = 71? + 7y? + 102? — 2xy — 4x2 + 4yz. 
c. F(x,y, 2) = 24? + 2y? + 52? — 42y + 202 — 2yz. 
2. Determine si las siguientes formas cuadráticas son equivalentes. 
a. F(X) =43?+40y+y? y Fa(Y)=16u? — 24uv + 9u?. 
b. F¡(X) =x3?+8%y+16y? y Fo(Y) =u? + 2uv+v?. 
3. Demuestre que la forma cuadrática F : R? — R dada por 
F(x,y) = ax? + 2bxy + cy? 


tiene rango 2 si y solo si ac — b? 4 0. 
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4. Determine los valores de q; para los cuales la matriz asociada a la 


forma F' : RÍ —R dada por 
F(x,y,2) =51 + y? +02? + 4xy — 232 — 2y2z 
tiene valores propios positivos. 


5. Sea A una matriz simétrica de tamaño n x n asociada a la forma 
cuadrática F(X) = XYAX con X € C”. Demuestre que F(X) es 


real. 


5.3 Diagonalización de una forma cuadrática 


Sea F (X ) = X'AX una forma cuadrática con n variables. Para simplifi- 
carla, se pasa de las variables 11,%2,...,1, a las variables yi, Yo, ..., Un 
y se supone que las variables anteriores están relacionadas con las nuevas 
mediante la fórmula X = PY, donde P es una matriz no singular. En- 
tonces 


XAX = (PY) A(PY) puesto que X =PY 
= (Y* P A(PY) 
= Y* (PLAP)Y = Y BY donde B es congruente a A. 


Así, F (X ) es equivalente a una forma cuadrática (Y) cuya matriz es 
B. En las nuevas variables no hay términos mixtos cuando la matriz B 
sea diagonal. Á este proceso se le llama diagonalización de una forma 
cuadrática. 


5.3.1  Diagonalización por completación de cuadrados 


Un procedimiento para diagonalizar una forma cuadrática es la genera- 
lización de la técnica familiar de completar cuadrados, aprendido en el 
álgebra elemental. El método que se va a estudiar a continuación consiste 
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en obtener una expresión canónica para F (X ) = X'AX en términos 
de los menores de la matriz asociada. Para facilitar la comprensión, se 
comenzará aplicando este método a las formas cuadráticas de dos y tres 
variables. 


Caso I. Si se considera una forma cuadrática en dos variables 
F(X) = ayaj + 2a190119 + 09923, (5.17) 


entonces F(X) se puede expresar como 


sia a a13| (21 
X'AX = [21,22] Ea al ls 


Si cualquiera a, o az es no nulo, sin pérdida de generalidad se 
puede asumir que aj, es distinto de cero. Entonces, (5.17) se puede 
escribir como 


2 2 
3 2 012 a12Y%_2 4131 2, a 2 
F(X) = 01117 + 2—:21%2 +4 2) 13 7 2) 
a 011 
aj y? [as ar yl, 
00 (009222) + [15- (22)] 
a11 q11 a11 


0192 2 1 
11 + 2 7) + POR [411092 = aa] 23) (5.18) 
11 


2 
p 
w 


Si se definen 


Y1 =211 + —22 y Ya =T2, 
011 


p=(M =p [0 [al 
Ya 0 1|i|z 


Entonces, (5.18) en términos de las nuevas variables queda 


se tiene que 


detA , 


F(Y) =a1Y4 + Ya» (5.19) 


y la forma (5.17) ha sido diagonalizada. La transformación de va- 
riables es no singular (det P = 1), pero no es ortogonal. Además, 
los coeficientes de y?, y3 en (5.19) no son, en general, los valores 
propios de la matriz asociada a la forma cuadrática A. 
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El lector puede verificar que cuando az % 0, entonces (5.17) se 
puede escribir como 


E a 2 1 
F(X) = 432% (12+ 01) +5 [411492 =- ajo] 2? ¿ (5:20) 
022 a3 


Si se define 


Y1 =T2+ 21 y Ya =T1, 
022 


dicha transformación de variables se puede expresar como 


g=(M -pg= [a ! [al 
Ya 1 0||2a 
Esta transformación de variables es no singular (det P = —1), pero 
no es ortogonal. Al reemplazar en (5.20), se obtiene 


det A 
Y. (5.21) 


F(Y) =d22Yi + 
En el caso de que a¡1, a22 ambas desaparezcan, el procedimiento 
anterior no se puede trabajar. Cuando ají = a929 = 0, la expre- 
sión (5.17) se vuelve 

F(X) = 20121119. (5,22) 
Ahora, se hace la transformación 
21 =Y1 +Y2 y T2 =Y1— Y2, 

la cual se puede expresar matricialmente como 


A JE 


Esta es una transformación no singular, la cual reduce (5.22) a 


F(Y) = 2a12(yi — y3). (5.23) 


En este caso, también la forma ha sido diagonalizada. 
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Caso II. Si se considera una forma cuadrática en tres variables 


3 2 3 
F(X) > y aja +2 y ye OiGLiLi, (5.24) 


F (X ) se puede expresar como X*AX, donde 


a11 412 013 Ñ 21 
A = faja 42 433 y X =|22 
413 023 033 73 


Si cualquiera a1,,499 O 433 es no nulo, sin pérdida de generalidad 
se puede suponer que aj; % 0. Entonces, (5.24) se puede escribir 


como 
3 3 2 3 2 

F(X)= a dm Y + STE, - Ns, 

y Ud a py 1 

3 
+ Y PRE 02 + 22 913 
y E 011 
a A1k ] - Okk 01k 2 
= 411 21 +25 =+ o qu - (2) 
— 011 q11 011 


2 2 
011023 — 0412013 
2 + 2 13 
011422 — 079 


2 2 
011023 — 0412013 2 
2 E 
011422 — 079 


2 2 
422 a12 , 011433 — 012013 
—=-[— 29 y 7 —t3| + 
a11 411 411499 — A%a 

2 
1 (a11093 — aj2013)7] >, 
L3 ñ 


2 
=> (aan aí3) 
2 2 
411 011422 — 412 
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Ahora, se asume que M33(4) 4 0 


F(X) A EN 
=4 21 + 22+ —x — =—— 
a o a az, Ma3(A) di 


1 


2 
—-Mas(A) a+ A ea » (5.25) 
011 411022 — 412 


Con la sustitución 


12 013 
Y1 = 11 + 12 + ——23, 
411 411 23 
411023 — 412013 Ya =L3, 
Ya = 12 + LT3, 


2 
011022 — 07 


1 Uu 213 
En Y1 En q11 q11 T1 
0 1 q11423- 0124013 
Y Ya PX ano -at, | |72 
Y3 0.0 1 T3 


Entonces, (5.25) en términos de las nuevas variables queda 


> Ma33(A) det A 
P(Y) = 1147 + ea ya y MA Yi, (5.26) 


y la forma (5.24) ha sido diagonalizada. La transformación de va- 
riables es no singular (det P = 1), pero no es ortogonal. Los coefi- 
cientes de y?, y3, yz en (5.26) no son, en general, los valores propios 


de A. 


Se puede verificar fácilmente que cuando Ma2(A) A 0, (5.24) se 
puede escribir como 


2 
a 012 013 1 detA _), 
F(X) = | 
( ) ent (2 + Ta 29) an MA) Ta 


Í NN 2 
— Ma(A) E 411023 ga 22 » (5.27) 
411033 — 013 


012 013 
Y1 = 11 + —-L2 + —23, 
q11 q11 an 
, 411423 — 412413 Y3z —= L2, 
Ya = T31 22, 


pa 
011033 — 013 
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dicha transformación de variables se puede expresar como 


1 q12 q13 
Yy1 a11 1 


q11 
Y Ya PX 0 2411023912413 1 29 


411422—4%9 


Y3 0 1 0 T3 


Esta transformación de variables es no singular (det P = —1), pero 
no es ortogonal. Al reemplazar en (5.27), se obtiene 


pe Mos A det A 
F(Y) = a gs En Y un MAA) ya: (5.28) 


El procedimiento que se describió puede generalizarse para diagonalizar 
cualquier forma cuadrática con n variables de la siguiente manera: 


Teorema 5.6 Método de reducción de Lagrange 


Sea F(X) una forma cuadrática en R” con matriz asociada A = EP 


luego: 
n n-=1 n 
FO = XUAX= Nat +2 y Y aus 
i=1 ¿=13j>1 


Entonces, existe una matriz triangular superior T' con elementos en la 
diagonal iguales a 1, tal que el cambio de coordenadas X=TY transfor- 


ma a X*AX en: 


Ta de al An 
F(Y) =Y'T'ATY = Ayyí 4 ñ ya y ñ eb E Aa yz, (5.29) 


donde A; 40, 1i=1,2,...,n son los determinantes de las submatrices 
angulares Aj de A. (An = det A). 
Demostración. 


La prueba se hace por inducción. Es claro que para n = 1, se cumple 
trivialmente. Para n = 2 y n = 3 se obtienen las formas cuadráticas (5.19) 
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y (5.26), respectivamente. Supóngase que es cierto para n — 1, es decir, 
existe una matriz de tamaño (n — 1) Xx (n — 1), 


1 tia tia ... tin-1 
0 1 t3 ... ftom-1 
SÓ 0 0 1 ... t3n—1 
0.00.) 0... 1 
tal que si E = (%1,%2,+..,8n-1) E RP??? y Aím-—1] es la submatriz 


angular de A de orden n — 1, usando el cambio de coordenadas Xp -1 = 
Tn - 1Yn-1, se tiene que 


S =; A» Az3 Di il 
XA ¡Amon 1 == Ai . Dl e a (8:80 
14n-1] 1 1Y1 As Ya A» Y3 Ba Uat ) 
y la matriz A se puede escribir como 
. > lin 
A sa | - | 
Al a e ales donde y = . 
U* 00] Ús le 


Si para cualquier Z € ¡R”7 1, se considera la matriz triangular 


Ta E 
J= . : 
p* 1 
entonces 
y A A E E 
HA] =SCAX = PAT SV | es e ar (5.31) 
donde 


Bi, = da 1Aim-1Tn-— 1 €s una matriz de tamaño (n — 1) Xx (n — 1) 
Bu =T. 1Am-1€+ Tí _,Ú es una matriz de tamaño (n—-1) x 1 


Ba = CAm-—18+ 2% Ú + any es un escalar. 
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Por la hipótesis de inducción, expresión (5.30), resulta que 
Y Aj Z o. 0 Yi | 
0 e aa 0 Y2 
Mia 
De ] o = ] 


Y2 
[Yiyoo< Ya] Bin : | = Mine Bi] 
UYn—1 Lo 0 


y como B32 es un escalar, para completar la prueba y obtener (5.29) 
bastará encontrar un € € IR” para que el vector columna B12 sea nulo 
? 


Tn —1 es no singular 


Para ello dado que 
Bi =Ti_¡(Am-ne+ 0) y 
Cc debe ser tal que 
Ain-12+ U =0. 
dd para el cual B¡2 es 


al 


+ = 
A 


Como det (Aín 1) F 0, existe un único € = Ar! 
un vector columna nulo. Si se reemplaza en Bea se tiene que 


B22 = Ann — 


y usando el Teorema 1.21, se tiene que 
det (4) = det(Ajn-1]) (Gan — U* Az," 0), 
luego 
det(4) An 
or 


B = 
EE det (Am-11) 


A 


Aj 


Al sustituir en la expresión (5.31), resulta 
A 

2 y 2% 

+ A» 


F(X) = YT ATY =Ayy? + 


Esto completa la prueba. Ml 
Ejemplo 5.7 Sea F(X) = 311 + 332 + 22112. Encuentre una diagonali- 


zación por el método descrito 
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Solución. 
Utilizando el resultado obtenido en (5.10), para n = 2, se tiene que 


vt y pa 2 
X"AX = 0111] + 09923 + 20191]29. 


Al comparar los a; con los coeficientes de la función F (X ), se obtiene la 


matriz 
3 1 
aa 
luego F (X ) se puede expresar como 


HAZ = [21,29] h a ba (5.32) 


En este caso, ya que A¡ = 011 =3% 0 y Az = det A =8, la forma (5.32) 
se puede diagonalizar de la siguiente manera: 


F(Y) =3yj +4, 
donde 
1 
Y =2X1 + gr2 y Ya = Ta. 
En forma matricial, se obtiene 
5 130, ER 1-1], 
e 3 Pa 3 
EE 


Aquí, se usó el hecho de que la transformación tenía determinante 1 y, 
por lo tanto, era no singular. De este modo 


p 1 
a al Mos gal -31 [3 1 1 3 
Fx) 2] [2-7 11 11.310. 4 
1 0113 03 <l3 0 2 
ARES 


Ejemplo 5.8 Considere la forma cuadrática dada en el Ejemplo 5.4 y 


determine una forma diagonal equivalente. 
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Solución. 
Haciendo referencia al Ejemplo 5.4, la F(X) se puede escribir como 
22 1| |x1 
XAX=lx 22 232 5 2| |x2|. (5.33) 
1.2 2] |23 
Dado que 
Ar =011 =2%X 0, Az = Ma3(A) = y Az3 = det A =7, 
se tiene que 
> 7 
F(Y) = 21 + 343 + 33, 
donde 
1 1 
yi Si Ya ETS y Y3 = 23. 
En forma matricial, se tiene que 
1113 1 -1 4 
Y =|0 1 ¿|X o X=|0 1 -—3|Y. 
0.0 1 0 0 1 


En la transformación anterior, se empleó el hecho de que la transformación 
tenía determinante 1 y, por lo tanto, era no singular. De este modo 


t 


1-1 E] [2 21 1-1 5 
FX) =X'AX=Y*|0 1 -—3| [2 5 2 |0 1 -—3|Y 
0 0.1 123110 0. 1 
1. 0 01/20 0 20.0 
=Y*|-1 1 0||2 3 O|Y=Y*l0 3 ol| Y. 
d. 1 7 7 
E 5 1112 0.0% 


Teorema 5.7 Sea F(X) una forma cuadrática asociada a una matriz 
simétrica real A. Sea L una matriz no singular triangular inferior tal que 


A se pueda factorizar como LDL*. Entonces, el cambio de coordenadas: 
Y = LX (5.34) 


transforma a XUAX en YtDY. 
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Demostración. 
La matriz A asociada a la forma se puede factorizar como 
A = LDU. 
Como A es simétrica, por el Teorema 3.5, U = £f. Por lo tanto, 
XLAX =X“(LDI")X 
=(X'D)D(L*X) 
= (EX) D(EX) =Y*DY, 


Así, queda probado el teorema. Mi 


puesto que A = LDL!* 


puesto que Y = LX. 


A continuación, se presenta una versión de este método de diagonaliza- 
ción: 


Procedimiento para diagonalizar una forma cuadrática 


¡) Halle la matriz de coeficientes simétrica A asociada a F(X). 
11) Obtenga la descomposición LDL* de A sin efectuar intercam- 
bios de filas que destruyan la simetría, y con elementos en 
D= diagídi1,da2,...,dnny no necesariamente distintos de 

cero. Forme L de manera que det(L) = 1. 


¿it1) Transforme a F(X) en di14% + da2Yy3 +... + dany?, bajo el 
cambio de coordenadas Y = LtX. 


Ejemplo 5.9 Considere la forma cuadrática dada en el Ejemplo 5.7 y 


determine una forma diagonal equivalente por el método descrito. 


Solución. 


La factorización LDL* de la matriz asociada a la forma cuadrática es 


Fall dio alo A: 


Luego, la F (X ) se puede expresar como 
AR 1 0] [3 1 3 lx 
X'AX = 3 , E 
di F | | ] : 1 A si 


Como L es no singular, se hace 


js 
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y F (X ) se puede escribir en términos de las variables y], y3 como 


pe 8 
F(Y) =3y1 +31: 


Ejemplo 5.10 Considere la forma cuadrática dada en el Ejemplo 5.4 y 


determine una forma diagonal equivalente. 


Solución. 
La factorización LDL* de la matriz asociada a la forma cuadrática es 


231 1.0 0 [2 0 07 [1 1 3 
2 5 2|=|1 1 0|[o 3 o[|0 1 3], 
1 2 2 33 1j[o 0 ¿||0o 0 1 
de modo que 
2.3 1 1.0 0[f2 0 0] [1 1 5 
FX) =X"|2 5 2 X=X"|1 1 o||o 3 o| fo 1 5/X. 
1 1 7 
L ¿2 22 a 3 11 /0.0 5] [0 0 1 
Nótese que L es no singular. Por lo tanto, se puede hacer el cambio de 
variable: 
115 
Y =|0 1 3|X 
0.0 1 


y se puede escribir eS ) en términos de las variables y, Ya, yg COMO 


E 7 
F(Y) = 2] +3y2 + ya: 


5.3.2 Diagonalización por transformación ortogonal 


En la diagonalización de la forma cuadrática F (X Í= X'AX a la forma 
F (Y) = YiBY, por el método de completación de cuadrados, solo se 
exigió que la matriz P fuera no singular. Puesto que la matriz A asociada 
a la forma cuadrática es simétrica, entonces se puede diagonalizar a F (X ) 
mediante una matriz P ortogonal, en cuyo caso los elementos sobre la 
diagonal de la matriz B son los valores propios de la matriz 4. 


256 5. Formas bilineales 


Teorema 5.8 Teorema de los ejes principales 

Sea F(X) una forma cuadrática asociada a una matriz simétrica real 
A con valores propios (no necesariamente distintos) A1,A2,..., An. Sea Q 
una matriz ortogonal propia que diagonaliza a A. Entonces el cambio de 
coordenadas: 


X =QY (5.36) 


transforma a XUAX en YtDY, donde 


D=GQ%AQ = diag[A, A, ... An). 


Demostración. 
La demostración consiste en un cálculo directo 


X'AX = (QY)'A(QY) puesto que X = QY 
= (Y 0) A(QY) 
= Y* (9'AQ)Y =Y'DY puesto que Q diagonaliza a A. 


Así, queda el teorema probado. Ml 


Nota 5.1 Si Q es una matriz ortogonal impropia, es decir, det Q = —1, 
se deben cambiar de signo todos los elementos de un solo vector columna 


(o intercambiar dos vectores columnas de (Q). 


El Teorema 5.8 se llama Teorema de los ejes principales porque de- 
fine nuevos ejes (los ejes principales) con respecto a los cuales la forma 
cuadrática tiene una expresión particularmente simple. 


A continuación, se presenta una versión de este método de diagonali- 
zación: 
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Procedimiento para diagonalizar una forma cuadrática 


¡) Halle la matriz de coeficientes simétrica A asociada a F(X). 


11) Encuentre los valores propios (no necesariamente distintos), 


M,A2,:..,An de A. 


111) Obtenga una base ortonormal para IR” formada por los vec- 
tores propios normalizados de A. 


¿w) Forme la matriz Q cuyas columnas sean los vectores de la 
base hallada en el paso ¿2), en el orden correspondiente al 
pa de los valores propios en el paso 14). La transformación 

= QY es una rotación si det(Q) = 1. 


v) Transforme a F(X X) en AyYi + A243 +... + Ange. 


Ejemplo 5.11 Determine los ejes principales de la forma cuadrática da- 
da en el Ejemplo 3.7. 
Solución. 


En el Ejemplo 5.7, se obtuvo que la F' (X ) se puede escribir como 


XUAX = [11,23] h a a l (5.37) 


En este caso, los valores propios de A son A¡ =2 y A2 = 4 y los vectores 


. . mn -1 3 1 . 
propios correspondientes son 4 = | y y Va = al respectivamente. 


Ú, En! 2 
lll L 1/V2]" 


y como [32 || = V2, se tiene da = an . Se puede verificar que la base 


Para encontrar (), como ||5, || = V2, se hace U1 = 


obtenida para R? es ortonormal observando que 1; - da = 0. Por lo tanto, 


N Cv UVA | 


Como el det(Q) = —1, intercambiamos las columnas y se tiene 


EI e 
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Si se definen los ejes principales como sigue: 


72-02-00 28 le) 


entonces (5.37) se puede escribir en términos de las nuevas variables y, Ya 
como Y*DY, o sea, 


dy? + 242. (5.38) 


Ejemplo 5.12 Considere la forma cuadrática dada en el Ejemplo 5.4 y 


determine sus ejes principales. 


Solución. 
Haciendo referencia al Ejemplo 5.4, la F (X ) se puede escribir como 


2 2 1 
AR = [21, 22, 23] 2: 0 2 T2| - (5.39) 
1.2 2 


Del Ejemplo 3.18, se tiene que 


1/42 1/43 1/v6 100 
Q = 0  -1/V43 2/v6 y QQ =|0 10 
1/42 1/V3 1/v6 0.0 7 


Por lo tanto, (5.39) se puede escribir en términos de las nuevas variables 
y1, Ya, y3 como Y*DY, o sea, 


yy + ya + Ty, (5.40) 
donde los ejes principales se obtienen como sigue: 


mM _ 1/42 0. 1/2] [x1 
Y =|lyw|=0Q'X 1/43 -1/V3 1/V3 | [22 
Y3 1/46 2/V6 1/v6 | lz3 
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5.4 Ley de la inercia para formas cuadráticas 


Sea F : R” => |R una forma cuadrática. Si p(A) = r, entonces toda 
matriz simétrica que represente a F' también tiene rango r. En particular, 
todas las formas diagonales a las que /" sea semejante, mediante una 
transformación lineal real invertible de variables, tendrán exactamente 
r coeficientes no nulos. Además, todas las formas diagonales a las que 
reduzcamos /" tienen el mismo número de coeficientes positivos y el mismo 
número de coeficientes negativos, como se afirma en el resultado obtenido 
por Sylvester. 


Teorema 5.9 Ley de la inercia de Sylvester 
Sean A una matriz simétrica de tamaño n xn y P una matriz no 


singular del mismo tamaño, entonces: 


In(4) = In(PYAP). 


Demostración. 
Sea Q una matriz ortogonal tal que 
Mm 0. ... 0 
: 0 Aa ... 0 
QAQ=D=|. . ., E 
| 0. 0... A 
de forma que A1, A2,..., A; SON positivos, A¿+1,Ai+2,---,Ai+3 SON Nega- 


tivos y el resto nulos. 
Sean A la matriz simétrica P?AP y W una matriz ortogonal tal que 


A 0 0 
E Ú A 0 
Lo Do 5, | 
de forma que e Eón dns os son positivos, Mi D Mo ms 43 son nega- 


tivos y el resto nulos. 

Se prueba por contradicción que ¿ = 7. Supongamos que 1>1. 

Sean 41,42,...,qí las primeras ¿ columnas de la matriz Q. Sean 
Fi, Po, -..,Fn las filas de la matriz R = W*P-!. Se forma una matriz 
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B de tamaño n x n, cuyas primeras filas sean las primeras ¿ columnas de 
Q transpuestas y el resto sean las filas ¿+ 1,1+2,...,n de R, es decir, 


es una matriz real de tamaño (i+n-—%) x mn, donde ¿+n—1< n. Por 
consiguiente, el sistema lineal homogéneo cuya matriz de coeficientes es 
B tiene solución distinta de la trivial y, por tanto, existe un vector u % 0, 
tal que Bú = 0. En otras palabras, el producto de cualquier fila de la 
matriz B por el vector u es cero, es decir 

para k=1,2,...,1 

para k =1+ ¡EA 


Al evaluar ú *Aú, se tiene que 
ú*Aú =ú 'QDQ'u, 


y al sustituir, se obtiene 


ú“Auú =]0 0 E Ñ 
PA dde vn] |: : | JUi41 
0.0 An : 
Un 
n 
= Y dm <0, (5.41) 
s=1+1 
donde, Us =(,+U para s =1+1,4+2,...,n. Por otra parte, 


atAd =a (PO API =ú*(P) WDwtp-lú=ú*RDRE. 
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Si se denota wj = FU para k =1,2,...,1, se tiene 


atAd=a*RDRi 


ll 
E 0 o | : Ñ 
0.A 0 Pa 
= [wr ws 0... 0] kl E 0, 
' 0 El : - 
0 


lo cual contradice (5.41). 


Análogamente, se demuestra que la hipótesis ¿ < 1 conduce a una 
contradicción. Por lo tanto, se debe tener que ¿ = 1. 


Con 3 y j se procede de la misma forma. Ml 


Teorema 5.10 Teorema de Euler 


Sea F(X) una forma cuadrática asociada a una matriz simétrica real 


A. El valor de F(X) — X'AX en un vector unitario U es 


n 
F(U) e y Aj cos” 0;, (5.42) 
j=1 
donde los Aj son los valores propios de la matriz simétrica A y los ángulos 
0; son los ángulos entre ha y los vectores propios ortonormalizados 4; 


correspondientes a los A;, respectivamente. 


Demostración. 


Sean (1,42, --., qn los vectores propios ortonormalizados de la matriz 
A y sea U un vector unitario arbitrario. Supongamos que 0; representa 
el ángulo entre U y q;, así que 


cos 0; =4 0 =g U, 
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Si se forma Q = Eñ Do... Gn] y se obtiene Y por la transformación 
U = QY o Y = QU, entonces, 


7 cos 01 

E cos 02 
Y=QU=|,|U=| ' 

Q di cos 0; 


Por lo tanto, 


HU == AU = FO AO =P DTS y Aj cos” 9, 
j=1 


y el teorema queda probado. Mi 
Ejercicios 5.3 


1. Diagonalícense cada una de las siguientes formas cuadráticas por 


completación de cuadrados y mediante transformación ortogonal: 


2, y) = 42? + day + y?. b. F(x,y) = 91? — 24xy + 16y?. 


6,8) = 2? + 8xy + 16y?. d. F(x,y) = 2? + 2xy + y? 


Fl 
pl 

e. F(x,y,z) = 61? + 3y? — 22% + 12xy — 18yz. 
F(x,y,z) = 73? + Ty? + 102? — 22y — 402 + 4yz. 
ll 


+ 52? — day + 232 — 242. 


2. Hallar una condición necesaria y suficiente en a,b y c tal que la 


forma cuadrática ax? + by? + cxy se pueda expresar como ku2. 
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5.5 Clasificación de las formas cuadráticas 


En esta sección se clasifican las formas cuadráticas según sus valores 
posibles. Una forma cuadrática /" : R” —= R es una función de valor real 
con dominio en R”. Luego, se pueden distinguir varias clases importantes 
de formas cuadráticas de acuerdo con los valores que estas asumen para 
diferentes PA dichos números reales pueden ser mayores que, menores que 
o iguales a 0. Obviamente, si el vector es X = 0, el valor siempre será 
0, por lo tanto no se tendrá en cuenta este vector. Por otra parte, si la 
matriz A es nula, F (X ) siempre dará el valor cero. 


Definición 5.12 


Dada F(X) = X'AX con AJO simétrica, se dice que es 


1. Definida positiva si F(X) > 0 para todo X 4 0 en R”, 


2. Semidefinida positiva si F(X) > 0 para todo X en R”, 


3. Definida negativa si F(X) < 0 para todo X 4 0 en R”, 
4. Semidefinida negativa si FX) < 0 para todo X en R”, 
5. Indefinida si EX) asume ambos valores positivos y negativos. 


La matriz simétrica asociada A se denomina definida positiva, semidefi- 
nida positiva, definida negativa, semidefinida negativa o indefinida según 


sea la forma cuadrática F(X) que define. 


Teorema 5.11 Sea A una matriz simétrica de tamaño n xn. Entonces, 


la forma cuadrática F(X) = X*AX es: 


1. Definida positiva si y solo si todos los valores propios de A son 


positivos. 


264 5. Formas bilineales 


2. Definida negativa si y solo si todos los valores propios son negativos. 


3. Indefinida si y solo si A tiene valores propios positivos y negativos. 


Demostración. 


1. Supongamos que A es definida positiva, sea A un valor propio de A 
y X el vector propio asociado a A, entonces 


XAX=XUX =AXX. 


== ¡PAR 
Luego, A = E 


números positivos. 


es positivo puesto que es el cociente de dos 


Las otras quedan como ejercicio para el lector. MM 


Ejemplo 5.13 Sea FX) = 32? + 3y? + 2xy. Determine qué clase de 
forma cuadrática es. 


Solución. 
En el Ejemplo 5.11, se obtuvo que los valores propios de la matriz 


asociada a la forma F(X) eran 2 y 4. Por lo tanto, dicha forma cuadrática 
es definida positiva. 


Ejemplo 5.14 Dada FX) = 22? + 4xy — y?, determine qué clase de 


forma cuadrática es. 


Solución. 
La matriz asociada a la forma cuadrática dada es 
2 2 
A= B he] | 
En este caso, los valores propios de A son A1 = —2 y A2 = 3. Por lo tanto, 


dicha forma cuadrática es indefinida. 


Teorema 5.12 Sea F' : V — R una forma cuadrática en el espacio vec- 


torial V de dimensión finita n. La forma FX) se dice que es definida 
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positiva si y solo si A = [a;¿] la matriz asociada a la forma F(X) tiene 
la propiedad de que todos los determinantes de sus submatrices angulares 
son positivos. 


Demostración. 
La demostración es por inducción sobre n. Para n = 1, la forma 
cuadrática F(X) está dada por 


en donde A = [a]. El teorema afirma en este caso que la forma F(X) es 
definida positiva si y solo si a > 0, lo cual es claro. 

Por el Teorema 5.8, la matriz A = [a] se transforma en la matriz 
Q%AQ, en donde Q es una matriz cuadrada de tamaño 1 x 1 no singular, 
esto es, Q = [q], q 4 0. De esta manera, 


Q'AQ = [q]la] [q] = ag”. 


En tal caso, siendo a > 0 y q 4% 0, se tiene que aq? > 0, así que la 
afirmación del teorema no depende de la base considerada en V para el 
caso n= l. 

Supongamos entonces que el teorema es válido para n = k— 1 y 
veamos si se cumple para n = k. 

Se demostrará primero que si la forma F (X ) es definida positiva, en- 
tonces los determinantes Ay, Az,... Az son positivos. Dado que la forma 
F(X) se puede escribir según (5.2) como 


k-1 k 


k k 
—— ) ) AijT¡Lj = z Qi Ti +2) ) Aj¡T¡Lj, 


1=137=1 i=1 (=>: 
esta se puede reescribir de la siguiente manera 


k-1 k 


y aja +2 y Y dijEiLj + Ar Th. (5.43) 


i=1 1=139>% 


Sea W un subespacio de V de dimensión k— 1 y considérese F* : W —= R 
una forma cuadrática en W tal que 


k-1k-1 


= Y ) QijTiLj. 


1=13=1 
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En efecto, la forma F* (% ) es definida positiva. Supóngase lo contrario, 
entonces existe un vector X* € W, digamos X* = (11, T9,..., Tp-1) 
tal que F E < 0. Ahora, formemos el vector X € V como sigue 
X= (21,12,...,1k-1,0) y evaluemos F(X X). Según la expresión (5.43), 
se obtiene que F (X ) < 0, lo cual contradice la hipótesis de que la forma 
F(X) es definida positiva. 

Por lo tanto, según la hipótesis de inducción, los determinantes de 
las submatrices angulares de la matriz de la forma F* (X ) son positivos. 
Estos son: A¡,A>,... Az — 1. Falta probar que Az, es también positivo. 

Pero por el Teorema 5.8, la matriz A asociada a la forma (5% dk 
mediante el empleo de una matriz no singular (Y, se transforma en la 
matriz 

D=0Q*AQ. 
Al tomar el determinante de las matrices en esta última expresión, se 
obtiene 
2 


det(D) = det(Q*AQ) = det(Q”) det(A) det(Q) = det(A) [det(()]”. 


Pero como det(Q) 4 0 y det(D) = N A¡, se tiene que! 
¿i=1 


det(A) == det(D) = Or Ir »>0. 


[det(Q)| 


Se ha probado así que Az = det(4) > 0, como se quería. 

Se deja como ejercicio para el lector probar que si los determinantes 
A¡,Az,... Az de alguna matriz (arbitraria pero fija) asociada a la for- 
ma cuadrática F(X) son positivos, entonces la forma F(X) es definida 
positiva. MM 


Ejemplo 5.15 Determine si la siguiente forma cuadrática es definida 


positiva: 


F(x,y,2) =21?*+5y* +22 + 4ry + 202 + 4yz. 


1 Véase el Teorema 5.11. 
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Solución. 
La matriz asociada a la forma cuadrática dada es 


22 1 
A=|2 5 2 
12 2 
Luego, los determinantes de las submatrices angulares son 


Az UN det(A¡1) = |2| =2> 0, Az = det (At) = : , =6>0 y 


22 1 
A3 = det(Aj3]) =/|2 5 21=7>0. 
12 2 


Como los tres determinantes A¡, Az, Az son positivos, se concluye, por 


> 


el Teorema 5.12, que la forma cuadrática F(X) es definida positiva. 


Corolario 5.12.1 La forma F' : V — R es definida negativa si y solo si 
A¡ <0,A2>0,A3<0,... Es decir, si los determinantes Ay, Az,... An 


alternan sus signos, comenzando con Aj < 0. 


Demostración. 
Es claro que la forma F': V — RR dada por 


F(X) =X*AX 
es definida negativa si y solo si la forma —/" : V — R 
—F(X) = X*'(-A)X 


es definida positiva. Según el Teorema 5.12, se debe tener entonces que 
los determinantes 


d11 —019 —013 
, Az=|-491 —492 —M93|,..., 
0431 032 033 


=011 —012 
021 —022 


Aj =|-az1|, Az = 


An = (-1)” det(4) deben ser positivos. Es decir que 


Ar = det|—a1] = — det[a31] >0 
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011  —412 a11 012 
Aa = = 04 >0 
021  —4022 a21 022 
411 —412 —4013 a11 412 013 
3 
A3 = |-a231 —a23 —as33| =(—1)” as as as3|>0, 
d31 —032 —033 d31 032 33 


y así sucesivamente, lo que prueba el corolario. M 


Teorema 5.13 La suma de dos cualesquiera matrices definidas positi- 
vas del mismo tamaño es definida positiva. Más generalmente, cualquier 
combinación lineal no negativa de matrices semidefinidas positivas es se- 
midefinida positiva. 


Demostración. 
Sean A y B matrices semidefinidas positivas, sean a+, P > 0. Si se 
denota C =0A + 8PB y se calcula 


X'CX =X(0A+BBIX =0AX AX) + AA BX) >0, VWX EC”, 


el caso de más de dos sumandos es tratado en el mismo sentido. Si los 
coeficientes Q/ y Ps son positivos y si A y B son matrices definidas positivas 
y además E 4 (, entonces cada término en la suma es positivo. Por 
consiguiente, una combinación lineal de matrices definidas positivas es 
definida positiva. Mi 


Teorema 5.14 Si A es una matriz simétrica definida positiva de tamaño 


n xn, entonces cualquier submatriz principal de A es definida positiva. 


Demostración. 

Sea K' un subconjunto propio de (1,2,...,n) y denotemos por Ax, 
la submatriz resultante de eliminar las respectivas filas y columnas de la 
matriz A, indicadas en K. Entonces A(,c) es una submatriz principal de 
A. Nótese que todas las submatrices se pueden obtener de esta manera; el 
número det[A4(1;)] es un menor de A. Sea X € C” un vector no nulo con 
entradas arbitrarias en las componentes indicadas por K y cero en las 
otras entradas. Denotando por E (x) el vector que se obtiene de eliminar 


los elementos nulos de X, obsérvese que 


SH ex - 2 
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Puesto que X KK) A O es arbitrario, esto significa que A(x) es definida 
positiva. MM 


Teorema 5.15 La traza, el determinante y todos los menores principales 
de una matriz simétrica definida positiva son positivos. 


Demostración. 

Sea A € Maxn una matriz simétrica definida positiva; luego, por el 
Teorema 2.20, se sabe que la traza y el determinante son respectivamente 
la suma y el producto de los valores propios, los cuales por el Teore- 
ma 5.11 son todos positivos. La otra parte del teorema se obtiene del 
Teorema 5.14. Mm 


Ejemplo 5.16 Determine si la forma cuadrática dada en el Ejemplo 5.15 
es definida positiva verificando si la matriz asociada a la forma cumple 


las condiciones del teorema anterior. 


Solución. 
Según el Ejemplo 5.15, la matriz asociada a la forma cuadrática es 


22 1 
A=|2 5 2 
12.2 
La tr(4) = 9 > 0, det(4) =7 > 0 y los determinantes de algunos menores 


son 


2 1 


det(M33) = E E 1.2 


28 ste) =| 


3 


Por lo tanto, la forma cuadrática dada sí es definida positiva. 


Teorema 5.16 Sea A € Mmxm definida positiva y P € Mmxn, entonces 
PYAP es semidefinida positiva. Además, p(PEAP) = p(P), así que PAP 


es definida positiva si y solo si P tiene rango n. 
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Demostración. 
Es claro que P?AP es simétrica. Para cualquier X € C”, se tiene que 


X'PLAPX =Y'AY >0, 


donde Y = PX y la desigualdad se sigue porque A es definida positiva. 
Así que P*AP es semidefinida positiva. Obsérvese que XPAPX >0 si 
y solo si PX a 0, ya que A es definida positiva. 

Supongamos que PX = 0, entonces por supuesto que PtAPX =0. 
Recíprocamente, si PtAPX =0, entonces XtPtAPX = 0, y usando el 
hecho de que A es definida positiva, se concluye que PX = (. Por lo 
tanto, PAPX =0si y solo si PX = O, lo cual significa que PFAP y P 
tienen el mismo espacio nulo (luego, también tienen el mismo rango). Ml 


Teorema 5.17 Desigualdad de Fischer 


Sea A una matriz cuadrada y definida positiva, particionada como 


A= Az1 Az l 


Az Az 
donde Aj y A22 son submatrices cuadradas, entonces: 


det A < det (411) det (49). 


Demostración. 
Queda como ejercicio para el lector. M 


Ejercicios 5.4 


1. Muestre que las entradas de la diagonal de una matriz simétrica 


definida positiva son números reales positivos. 


2. Muestre que los valores propios, traza, determinante y menores 
principales de una matriz semidefinida positiva son todos no nega- 


tivos. 
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3. Muestre que si A € Mo es definida positiva, entonces a11499 > 


Ja19/?. 


4. Si A es de tamaño m x n de rango n < m, muestre que AA es 


definida positiva y que 44% es semidefinida positiva. 


5. Si A es de tamaño m x n de rango k < mínfm, nj, muestre que 


AYA y AA? son semidefinidas positivas. 


5.6 Aplicaciones a la geometría analítica 


En esta sección se pretende poner al alcance de los lectores un algoritmo 
proporcionado por el método de “valores propios y vectores propios” para 
tratar con más generalidad, agilidad y libertad algunos objetos de la 
geometría analítica de no fácil manipulación por los métodos tradicionales 
usados para el estudio de las ecuaciones cuadráticas. 


Definición 5.13 Ecuación cuadrática 


Una ecuación en las variables x y y de la forma: 
ar +by+cxoy+de+ey+f=0, (5.44) 


donde a, b,..., f son números reales con al menos uno de los números 
a, b, ec, distinto de cero, se denomina ecuación cuadrática de segundo 


grado. Esta se puede escribir en forma matricial como 
XAX+2K'X+$f$=0. (5.45) 


En esta notación, la expresión X*AX es la forma cuadrática asociada y 


el vector K € R? es Kt= [S Sl. 
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Definición 5.14 Tipos de ecuación cuadrática 
Las curvas representadas por la ecuación cuadrática de segundo grado 
dada en (5.44) se pueden clasificar según la posición en la cual estén con 


respecto a un sistema coordenado cartesiano X, así: 
1. Estándar o canónica, si tiene su centro en el origen. 
2. Trasladada, si tiene su centro en un punto diferente del origen. 


3. Rotada, si su posición con respecto al sistema X no es canónica ni 
tampoco trasladada, pero es posible encontrar un sistema Y con el 
mismo origen del sistema X, y tal que los ejes coordenados de Y 
forman con los ejes coordenados del sistema X un ángulo agudo 0, 


con respecto al cual la curva está en posición canónica. 
Teorema 5.18 Si en la ecuación general de segundo grado: 
ar? +by+cxoy+de+ey+f=0, (5.46) 


la matriz A que representa a la forma cuadrática asociada es no singular, 
entonces al trasladar el origen de coordenadas al punto Xo = —ATIK, el 


cambio de coordenadas X = X — Xp transforma a (5.46) en 
a? +07 + crG+ f=0, (5.47) 


donde f= f-— KAIK y el vector Kkt= [ 5] ¿ 


Demostración. 
La forma cuadrática dada en (5.46) en forma matricial queda 


XAX+2K'X+f=0, 
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donde 


a 
le 
3 


al sustituir X= X + Hd se tiene 


Sula 
A 
<S 
y 
+ 
| 
=— 
NA 
NO 
3 


Ax +2[AX0 + EX + [XGAX0+2K*X0+f] =0, (5.48) 
luego, Xy será un centro si 
AXo+K =0, es decir, Xo = -A TK. (5.49) 
Por lo tanto, 
AA EFI 4] E CA KIA TK] 


f =f-—KATK. 
SiX =|Í[% y), al reemplazar en (5.48), se obtiene 
a? +7 +c7G+f=0, 
la cual representa la traslación de origen y es lo que se quería demostrar. 


Ejemplo 5.17 Dada la ecuación cuadrática: 
3x7? + 22y + 3y? -9=0, (5.50) 


elimine el término cruzado xy utilizando el Teorema 5.8, escriba la ecua- 
ción en términos de las nuevas variables e identifique la sección cónica 


obtenida. 


Solución. 
En el Ejemplo 5.11, se vio que la forma cuadrática asociada 3x? + 
2xy + 3y? se puede expresar como 


du? + 2v?. 
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Luego, la ecuación cuadrática dada en (5.50), se puede escribir como 
du? + 24? =9, 
la cual es la ecuación de una elipse estándar. Puesto que K =( entonces 


su centro es el origen del sistema. Por lo tanto, (5.50) es la ecuación de 
una elipse estándar rotada. Vea la representación en la Figura 5.1: 


Figura 5.1: Elipse rotada. 


Ejemplo 5.18 Dada la ecuación cuadrática: 


21? + 4xy — y? - 21 +3y-6=0, (5.51) 


elimine el término cruzado xy utilizando el Teorema 5.8, escriba la ecua- 
ción en términos de las nuevas variables e identifique la sección cónica 


obtenida. 


Solución. 
La forma matricial de esta ecuación cuadrática es 


X'AX+2kK*'X -6=0, (5.52) 
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donde 
Z, 2 7) 3 
A=| A , K=[=1 3). 
En este caso, los valores propios de A son A1 =—2 y A2 = 3 y los vectores 


-1 
2 
identificación de la sección cónica se hace en dos etapas, las cuales se 
pueden realizar de las siguientes formas: 


' . La a 2 . 
propios correspondientes son Y = | | y Y = A , respectivamente. La 


1. Primero, trasladar el origen de coordenadas al centro de la curva 
y luego girar los ejes en el ángulo respectivo. Puesto que A es no 
singular, empleando la expresión (5.49), se determina el centro (Xo) 


como 
S so A A de 
= o ATRRR =p 
AE E AU El 


donde X = X — Xp. Para encontrar (Q, se usa la expresión (5.7) 
dada en la definición de inercia, la cual establece primero los valo- 
res propios positivos y luego los negativos. De esta manera, como 


La me 2 Ma > 
[sal = 5, se hace dia = E = [7 y como [[al] = Y, se 
[al y511 
1 |-1 
tiene uy = E | Al . Se puede verificar que la base obtenida para 


R? es ortonormal observando que dy - da =0. Por lo tanto, 
112 —1 y 3 0 


Dado que el det(()) = 1 se define 
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donde Y = QX y Yo = Q*Xo, entonces, la expresión (5.53) se 


2 2 


puede escribir en términos de las nuevas variables Y, y como X DX, 
es decir, 


53 
18 


(e a 


la cual es la ecuación de una hipérbola con centro en (5 5) . Por 
p 6v5” v5 


37? Z 27 


lo tanto, la ecuación (5.51) es una hipérbola rotada y trasladada. 


. Girar los ejes, dándoles las direcciones principales de la curva y 


después efectuar una traslación de los ejes girados. Este método se 
puede emplear cuando A es singular, y para ello, se define 


03 


Al sustituir en (5.52) el cambio de variable propuesto en (5.55), se 
tiene 


> HAS 1 2 —1|[u 1 u 

ty _ opt A a E 
E JA A A pl 1 JNE 
Luego, la ecuación cuadrática dada en (5.51) se puede reescribir 
como 
1 8 


u+ v=6. 
Ya  v5 


Naturalmente, esta no es la ecuación de una cónica en posición 


du? = 2? 


canónica, pero sí está trasladada porque al completar los cuadrados, 
se obtiene 


3|u2 o 214? E =6 da 
3v5 180 Va 5] 5 60 


dll 


Nótese que esta cónica es la misma que se obtuvo en (5.54). La 


representación gráfica aparece en la Figura 5.2: 
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Figura 5.2: Hipérbola rotada y trasladada. 


5.6.1 Rotación de ejes en R? 


Como ya se ha señalado, una transformación Y = Q*X, donde Q es 
ortogonal, se llama transformación ortogonal. Ahora, se examina la in- 
terpretación geométrica de estas transformaciones en R?. 


Teorema 5.19 Rotación de ejes en ¡R? 
Sean B = (8, e) la base del sistema coordenado X y B' = Le, €n 


la base correspondiente al sistema Y. Entonces si 
>/ = y E 
e; = ajjel + 495€2, para 7 =1L.2: 


las coordenadas (11,12) de un punto cualquiera P en el sistema X y las 
coordenadas (y, ya) del mismo punto en el sistema Y están relacionadas 


como sigue: 
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donde A = la;;] es la matriz de transición (o matriz de cambio de base) 
de BD a B'. 


Demostración. 

Supongamos que los sistemas coordenados X y Y (en R?) tienen el 
mismo origen O. Sea OP el vector formado desde el origen del sistema 
coordenado X al punto P = (11,12), entonces 


a > > 
OP = 211€] + 29282. 


Por otra parte, el vector OP formado desde el origen del sistema coorde- 
nado Y al punto P = (y, ya), es 


AD > > 
OP =yiéj + ya) 
S =y1(ar1é + 0Q21 


2 (a1281 + a2282) 
= (y 1011 + y2a19) €1 
pr? 


+ Y2 

+ (y1a21 + yaa99) > 
RÁ 

er+ 


») 


= í1 La €9. 


— 
Aquí, se usó el hecho de que la representación de OP como combinación 
lineal de €; y e2 es única. Luego, 


11 =411Y41 + 01242 ye 12 = 02141 + 02242, 


y el teorema queda probado. Mm 


5.6.1.1 Cambio de dirección de ejes en R? conservando el mis- 


mo origen 


Consideremos que el sistema coordenado X (en R?) es rectangular y 
tiene unidades iguales sobre ambos ejes. Esto significa que si € y e€2 son 
los vectores base (unitarios), entonces son perpendiculares entre sí. 

Supongamos que los ejes coordenados Y se obtienen haciendo girar el 
sistema X un ángulo 0 alrededor del origen, en sentido contrario al de las 
manecillas del reloj, conservando la ortogonalidad. Los vectores base € 
y €s del sistema Y, forman también una base ortonormal y están dados 


por 
e = [cos 0, sen 0] = cos 0é, + sen €». 


e) = [- sen 6,cos 0] = — sen 0é, + cos Oe». 
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Xa 


EN 


(- sen 0, cos 6) 


(cos 6, sen 9) 


Xi 


Figura 5.3: Rotación en R?. 


Se deduce por el Teorema 5.19 que las coordenadas de un punto en 
ambos sistemas están relacionadas por 


11 =Y,C08Ó — ya sen 0 y x9 = y, senó + ya cosÓ, (5.56) 


que son las ecuaciones de una rotación levógira de ejes, cuando el ángulo 
girado es 0. Si se denota por Ag la matriz ortogonal 


cosó —senó0 
BE a cos 4 | Ñ (5.57) 


entonces (5.56) se puede expresar matricialmente como 
21 Yi 
=A 
El i A 


la cual es una transformación ortogonal propia, puesto que el det 4y = 1 
y representa cualquier rotación de ejes en R?, 


A continuación, se presenta un teorema para obtener el ángulo de rotación 
9 de una ecuación cuadrática de segundo grado. 


Teorema 5.20 Sea la ecuación general de segundo grado: 


ar? + by? +cxy+dx+ey+f=0. (5.58) 
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Entonces existe un número único 0, llamado ángulo de rotación, tal que 


1 C T 
9=3 arctan( 5), 9 e [0,5). (5.59) 


Demostración. 
La matriz que representa la forma cuadrática dada en (5.58) es 


a=|: al (5.60) 
Supongamos que Á es un valor propio de A con vector propio unitario 


correspondiente Xt = [cos 0 sen 9l, luego AX =AX. Si se premultiplica 


por Xt, se obtiene 
PAX == 
Al sustituir X y A, se tiene 


A = [cos sen 0] 


A 
a 


3| [cos 9 
o b| [senó 
=a cos. 0 +c sen0Ocos0 + bsen? Y 


= (a—b) cos?9 + c sen0cosO + b. 
Si se multiplica por 2 y se usan las siguientes identidades trigonométricas 
2cos? 9 = cos(20) +1 y sen(20) = 2sen0 cosÓ, 
se llega a 
24 = (a—b) cos(20) + ce sen(20) + (a + b). 


Pero como A es valor propio de A, se tiene que 


2) =tr(4) + 1/t2(4) — 4det(4). 


Al igualar estas dos expresiones, se obtiene 


(a — b) cos(20) + csen(20) + (a +b) = tr(A) + y tr2(4) — 4det(A), 
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pero tr(A) = a + b, por consiguiente 


(a — b) cos(20) + csen(20) = + y/te2(4) — 4det(4) 

a—b 6 
aaa aa 
A AA A 

7) cos(20) + v sen(20) = 
Luego, 


(u a = (1 — ucos(20))? 
v”sen*(20) =1-— 2ucos(20) + u* cos”(20) 
v?(1—cos?(20)) =1-—2u cos(20) + u? cos? (28). 
El lector puede probar fácilmente que u? + uv? = 1, de manera que 
cos-(29) — 2u cos(20) + (1—u*) =0 
[cos(20) — uJ? =0 
. u=cos(20). 

Por lo tanto, v = sen(20) y entonces 


6 


- =19n(20) = (5.61) 


a — 


Al tomar arctan a ambos lados de (5.61), se obtiene la ecuación (5.59). 
a 


Nota 5.2 Si la matriz que representa una forma cuadrática tiene la 


forma (5.60), entonces el ángulo 9 de rotación satisface que 


sen(20) = E = 
ZA — det A A — dz tan(20) = >. (5.62) 
a — a — a — b 
cos (29) = 


vVtr2 A— 4 det A _ A1 — Az 


Por otra parte, si se usa la siguiente identidad trigonométrica 


2tanó 


id AT 
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al sustituir en la última expresión dada en (5.62) se tiene que 


2tanó C 


l—tan?9  a—b 


2(a—b)tan9 =c(1— tan? 9). 


Al resolver esta ecuación cuadrática, se llega a 


a ad4tr2 A — 
miis Ea PEPA (5.63) 
E C 


Ejemplo 5.19 Determine el ángulo de rotación de la ecuación cuadrá- 


tica dada en el Ejemplo 3.17. 


Solución. 
La matriz simétrica asociada a la forma cuadrática es 


an 


La ecuación (5.61) no es aplicable ya que como a = b se dividiría por 0, 
se usa (5.63) y se tiene que 


tanó = 1. (5.64) 


Cualquier solución de (5.64) sirve a nuestro propósito. Si se escoge la 
solución para la cual 0 < 0 < 907, entonces sen(0) = yo y cos(0) = 


Ta es decir, el ángulo de rotación O vale aproximadamente 0 = 45? y, 


construyendo la matriz de rotación (5.57), se tiene que 


0 = 1/v2 1/42 ) 


la cual coincide con la matriz ortogonal dada en el Ejemplo 5.11. 


Ejemplo 5.20 Determine el ángulo de rotación de la ecuación cuadrá- 


tica dada en el Ejemplo 5.18. 
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Solución. 
La matriz simétrica asociada a la forma cuadrática es 


Por la ecuación (5.61), se tiene que 


tan(29) = = =3 (5.65) 


Cualquier solución de (5.65) sirve a nuestro propósito. Si se escoge la 
solución para la cual O < 29 < 90?, entonces sen(29) = $ y cos(20) = ; 
y como Ú es un ángulo agudo, 


1 — cos 20 e! 


2. 15 


1 +cos 20 2 
2 vV5 


senO = y  cosO = 


Es decir, el ángulo de rotación 0 vale aproximadamente O = 2633'54.18" 
y, construyendo la matriz de rotación (5.57), se tiene que 


0 — 1/v5 2/v5 > 


la cual coincide con la matriz ortogonal dada en el Ejemplo 5.18. 


5.6.2 Clasificación de las ecuaciones cuadráticas 


Para la ecuación general de segundo grado: 
ar? +by+cxy+de+ey+f=0, (5.66) 


se definen las cantidades 


> 
! 


No 
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donde K*t = [S e] y w, p son los coeficientes de PA), entonces la 


ecuación (5.66) representa los siguientes lugares geométricos (L.G.): 


wv<O Una elipse 
p>0 A ld Ninguno 


LAO v=0 Un punto 
vA%0 Una hipérbola 
EEN En l v=0 Dos rectas que se cortan 
vÁ0 Una parábola 
p=0 li Dos rectas paralelas, 


o una recta, o ninguno. 


El cuadro anterior se acostumbra a interpretar como sigue: 


De tipo Una elipse (ww < 0) 

Curva elíptico 

con (ps 0) Caso degenerado (ww > 0) 
centro De tipo Una hipérbola (v 4 0) 

LG (1 4 0) hiperbólico 
q (1 <0) Caso degenerado (v = 0) 

Curva 

e Una parábola (v 4 0) 
centro 

Caso degenerado (yv = 0). 

(u=0) E e 


Cuando y % 0, la ecuación cuadrática (5.66) también puede ser clasifi- 
cada de acuerdo con la inercia de la matriz A asociada a la forma cuadráti- 
ca, Como sigue: 


Identificación de las ecuaciones cuadráticas 
Inercia Nombre de la cónica 

In(A) = (2,0, 0) Elipse 

In(A) = (1,1,0) Hipérbola 

In(A) = (1,0, 1) Parábola 


Las formas cuadráticas también pueden usarse para analizar ecuaciones 
de superficies cuádricas en el espacio. 


Definición 5.15 Superficie cuádrica 


Una ecuación de segundo grado en x,y, y z de la forma: 


ar? +by?+c2? + dxy+ex2+ fyz+gr+hy+iz+j=0, (5.67) 
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donde a, b,...,j son números reales y la] +|b] + |c| +|d|+]|el +|f| 4 0, se 
denomina superficie cuádrica. Esta se puede escribir en forma matricial 


como 


XAX+2k'X+j5=0. (5.68) 


En esta notación, la expresión X*AX es la forma cuadrática asociada y 


el vector K € R3 es dado por Kt= [ 


wa 
5 
S 

pida 


Teorema 5.21 Si en la superficie cuádrica: 
ar +by?+c22+4+dxy+ex2+ fyz+gr+hy+iz+j=0, (5.69) 


la matriz A que representa a la forma cuadrática asociada es no singular, 
entonces al trasladar el origen de coordenadas al punto Xo = —ATIK, el 


cambio de coordenadas X = X — Xo transforma a (5.69) en 
a? RA A + d+ enz + f92+3=0, (5.70) 


donde j=¡j— KA“ K y el vector K* = [2 h 5). 


Demostración. 
La superficie cuádrica dada en (5.69) en forma matricial queda 


XAX+2K'X +3 =0, 


donde 
d 
E a ? et h 
a y K"=[9 3 al, 
e Í 
9 2 


y al sustituir X=X+ Xos se tiene 


2to> 


X ACERA EA REO 6 
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Luego, Xy será un centro si 
AXo+K =0, es decir, Xo = -A TK. (5.72) 
Por lo tanto, 


XAXo+2K'Xo+j =K'A?K-2K'A4*K+5 
pr) 


j =j-—K'ATK. 


2t 


SiX =|Í[x% y 2], al reemplazar en (5.71), se obtiene 
a 2 day + nz + Py + 3=0, 
la cual representa la traslación de origen y es lo que se quería demostrar. 


Ejemplo 5.21 Considere la ecuación cuadrática: 
21? + 5y? + 22? + dey + 232 + dyz — 36 =0. (5.73) 


Determine la superficie cuádrica obtenida al eliminar los términos de 


productos cruzados. 


Solución. 
Haciendo referencia al Ejemplo 5.12, dicha ecuación cuadrática se 
puede escribir como 


X'AX =36, (5.74) 
donde 


2.2 1 
A= 12 542 
123 
En este caso, (5.73) se puede escribir en términos de las nuevas variables 
u, v, wcomo Y*DY = 36, o sea, 
u? + uv? + 7w? = 36. (5.75) 


En R*9 la superficie definida por (5.75) se llama elipsoide. 
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Ejemplo 5.22 Considere la ecuación cuadrática 


7a? + 7y? + 102? — 2xy — 402 + 4yz — 12% + 12y + 602 — 24 =0. (5.76) 


Determine la superficie cuádrica obtenida al eliminar los términos de 


productos cruzados. 


Solución. 
La forma matricial de esta ecuación cuadrática es 


X'AX+2k*'X -24=0, (5.77) 
donde 
F dl =D) 
A=|-1 7 2 y K* =|[-6 6 30]. 
— E TU 


En este caso, los valores propios de A son A¡ = 12 y A2 = 6 (de mul- 
tiplicidad algebraica 2). El vector propio correspondiente a A = 12 es 


-1 1 2 
vi = | 1| y los correspondientes a 42 = 6 son Ya = |1| y U3 = |O|, res- 
2 0 1 


pectivamente. Para determinar la sección cónica, se hacen en dos etapas, 
las cuales se pueden realizar de las siguientes formas: 


1. Primero, trasladar el origen de coordenadas al centro de la curva 
y luego girar los ejes en el ángulo respectivo. Puesto que A es no 
singular, empleando la expresión (5.72), se determina el centro (Xo) 


como 
y [1 1 2] [-6 0 
Xo = E 1 11 -2|| 6|=| 0 
3 8l 130 e 


y j=j=K'A71K =-114, por lo tanto la ecuación (5.77) queda 


SÉ Y —-1 -2 zx 
XAX+j=[x y 2+3] |-1 7 2 y | -114=0, 
=2 2 101: l6+3 
(5.78) 
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donde X = X — Xp. Para encontrar la matriz (Q), se ortonor- 

malizan los vectores propios de A, como ||%,|| = vV6 se hace 
> -1 

me VI 1 y ; 

u —= | 1|. Después, se aplica el proceso de ortonor- 


1 = = = 
[Al v6 |, 
malización de Gram-Schmidt a (02,13) para obtener una base 
ortonormal del espacio propio B2. Puesto que |/U2|| = V2, se tiene 
al 1 
= 1| . Por último, 


Il 
uo == = == — 
EA 


2 9 [1/v2 
Uz = 03 — (03 U3)la = 0| == 1/y2 
1 v2 0 
2 1 1 
1 0 1 


1 
Entonces, [03] = V3 y da = — |—1| . Se puede verificar que la 
v3 | y 
nueva base de Bo es ortonormal observando que us - uz = 0. Tam- 
bién, se puede verificar que la base obtenida para I¡R* es ortonormal 
observando que uu] - Y = 0 y us - uz = 0. Por tanto, 


-1 Y3 y2 
Q==G|1 Y3 —v2|. 
v6 2 0 -y/2 


Como det(Q) = —1, se multiplica la tercera columna por —1 y se 
tiene 
L Fl Y3 -v2 12 0.0 
Q==|1 Y3 Y2l y 040 =D=|0 6 0 
“6 lo 0 -y2 0.056 


Si se define 


E 2 
X=|3| =Q'(X-Xo) == 0 
z Vllya ya val lo+3 
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donde Y = QX y Yo a QXo, entonces la expresión (5.78) se puede 


2t 2 


escribir en términos de las nuevas variables TZ, y, 2 como X DX,o 
sea, 


12% +6 + 6%  =114 
2 2 
12(u +6) +60 +6(w-v3) =114, (5.79) 


la cual corresponde a la ecuación de un elipsoide con centro en 
(46, 0, v3). Por lo tanto, la ecuación (5.76) es un elipsoide rotado 
y trasladado. 


. Girar los ejes, dándoles las direcciones principales de la curva y 
después efectuar una traslación de los ejes girados. Este método se 
puede emplear cuando A es singular, y para ello se define 
Ñ u Ñ 1 -1 1 2 zx 
Y=lu| =0'X==|YyY3 yY3 0 yl. (5.80) 
0 ve [ya y2 —y2l l: 


Al sustituir en (5.77) el cambio de variable propuesto en (5.80), se 
tiene 


1 =1 ya =y2 u 
—[-12 12 60)| 1 yY3 y2 V 
v6 Y —y2 wW 
=[ 2446 0 -1243 ] e 


wW 


2K*X =2K*QY = 


Luego, la ecuación cuadrática dada en (5.76) se puede escribir como 
12u? + 6u? + 6w? + 24/64 — 12/30 = 24. 
Al dividir por 6 y completar los cuadrados, se obtiene 
2[u? + 2/64 + 6] + 0? + [w? — 2V3w +3] =4+12+3, 
o bien, 
E 2 
2u + v6] +uó+ [w — v3] =19. 


Nótese que esta superficie es la misma que se obtuvo en (5.79). 
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5.6.3 Rotación de ejes en R* 


La interpretación geométrica dada a las transformaciones ortogonales en 
R? puede generalizarse para R*%. Esto es, si Y = Q*X representa una 
transformación ortogonal de coordenadas en R*, entonces las columnas 
de la matriz de rotación Q están dadas por los cosenos directores de los 
nuevos ejes de referencia con respecto al viejo sistema de referencia. 
Definición 5.16 Rotación de ejes en R* 

Una rotación de ejes en R? es una transformación ortogonal propia 
que permite pasar a una nueva base a partir de un movimiento rígido y 


continuo de los vectores base del sistema primitivo, conservando el origen 


fijo y preservando la ortogonalidad. 


Teorema 5.22 Rotación de ejes en ¡R* 
Sean B = [é,, €2, 83) una base del sistema coordenado X y B' = 


Le, En E) la base correspondiente al sistema Y. Entonces si: 
> > > > . 
e; = a1je1 + 095€2 + 03503, para q == 1.2.3 


las coordenadas (x1,1%2,13) de un punto cualquiera P en el sistema X 
y las coordenadas (y1,Yy2,Y3) del mismo punto en el sistema Y están 


relacionadas como sigue: 


X1 411 012 013 Yi Yi 
Ta| — |Q21 M2 M2g3| |Ya| — A Ya| > 
L3 a31 432 033 Y3 Y3 


donde A = [a;¡] es la matriz de transición (o matriz de cambio de base) 
de BD a B'. 


Demostración. 
Queda como ejercicio para el lector. M 
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5.6.3.1 Cambio de dirección de ejes en R* conservando el mis- 


mo origen 


Consideremos que el sistema coordenado X (en IR*) es rectangular y 
tiene unidades iguales sobre sus tres ejes, lo que significa que €, €2 y €3, 
que son los vectores base (unitarios), son perpendiculares entre sí. 

Sea €, € y es la base ortonormal del sistema “Y. Denotemos los 
productos puntos entre las dos bases por 


aj = (84, Ej). 


Por ejemplo, az¿ = (€1, €), a2¡ = (€2,€;) y 03; = (€3, €) son las tres 


con respecto a la base anterior €], €2, €3 y podemos 


Y 


componentes de e j 
poner 


> > > > . 
e; = a1jé1 + a2je2 + Agje3, q =1,2% 3: 
Como ej es también vector unitario, se tiene que 


as = cos (€, €) (5.81) 


aj; +43 +03 =1, j=1,2,3. 


Además, como €y, €, €z son ortogonales por pares, es decir (8;,€;) =0, 
1% j, se obtiene que 


01501k + 09502k + A3j03k = 0, LE <iEÚE 


5.6.3.2 Fórmulas de Euler 


Euler introdujo en mecánica del sólido rígido unas fórmulas que per- 
miten fijar la posición del segundo sistema coordenado con relación al 
primero, empleando únicamente tres coordenadas angulares, las cuales se 
denominan ángulos de Euler. 

Los movimientos resultantes de variar uno de los ángulos de Euler de- 
jando fijos los otros dos, se llaman “rotaciones de Euler” y tienen nombres 
particulares: precesión, rotación intrínseca y nutación. 

Estas rotaciones no son ni intrínsecas ni extrínsecas en su totalidad, 
sino una mezcla de ambas nociones. La precesión es extrínseca, la rotación 
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intrínseca naturalmente intrínseca, y la nutación es una rotación interme- 
dia alrededor de la intersección de los planos elegidos, la cual se denomina 
“línea de nodos”. Estas rotaciones son commutativas. 

Sean X1, X2, X3 los ejes del sistema coordenado X y representemos 
por Y¡, Ya, Y3 los ejes del sistema de referencia móvil. Se desea definir 
una transformación ortogonal Y = Q*X, que exprese las coordenadas 
(y1, ya, y3) de un punto arbitrario en términos de sus coordenadas iniciales 
(11, 12,13). Para formular analíticamente esta transformación, se pasará 
del sistema de referencia de ejes ortogonales X a otro sistema de referencia 
con origen común Y mediante tres cambios sucesivos, conservando la or- 
togonalidad. En cada cambio, se asumirá que se tiene en común con el 
sistema precedente un eje y el plano opuesto. De esta manera, no se e- 
xigirán más que las fórmulas correspondientes al cambio de ejes situados 
en el mismo plano. 


Figura 5.4: Rotación en R?. 


10. Se obtienen unos nuevos ejes W, Wa, W3 = X3 rotando el plano que 
contienen los vectores e€1 y € del sistema X un ángulo y alrededor 
del eje X3, en sentido contrario al de las manecillas del reloj. Por el 
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ge. 


a 


Teorema 5.22, se tiene que las coordenadas de un punto en ambos 
sistemas están relacionadas por 


TX] =W]C08(( — Wa sen, 
12 =W] SEN P + Ww2 COS, (5.82) 


Al expresar dicha rotación en forma matricial, se obtiene 


wi cosp  senp 0| |x1 21 
wao| = |—senp cosp 0| [z2| =Ry |22 
03 0 0 1 23 23 
Se generan otros nuevos ejes Zi = W¡, Za, Z3 rotando el plano 


determinado por los ejes Wa y W3 un ángulo 0 alrededor del eje W,, 
lo que hará tomar al eje X3 la posición Y3 y al Wa la Z3. Luego, por 
el Teorema 5.22, se deduce que las coordenadas de transformación 
de un punto, serán 


wi =21, 
wa =2z2C0s0 — z3sen0, (5.83) 


w3 = zosenW + z3c0s0. 


Si se expresa (5.83) en forma matricial, se tiene que 


21 1 0 0 wi w1 
za =|0 cosó sen9| [w»| = Ry | wa 
23 O —senó cosG| | 103 w3 


Finalmente, se rota alrededor del eje Z3 = Y3 el plano que contiene 
a los dos ejes Za y 243 hasta que formen un ángulo 4, así quedará 
W¡ en Y¡ y Za en Y3 y por el Teorema 5.22, las coordenadas de un 
punto en ambos sistemas están relacionadas por 


21 =Yy1Cosp — ya sen y, 
Za = Yy1 sen Y + ya cos Y, (5.84) 
23 = Y3- 
Al expresar (5.84) en forma matricial, se obtiene 
Yi cosp  seny 0| |z1 21 


y2| = |—senp cosp 0| |[z2| =Ry | 22 
Y3 0 0 lll 23 
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La eliminación de los sistemas coordenados W y Z en las ecuacio- 
nes (5.82), (5.83) y (5.84) dará la transformación del producto Y = RX, 
mediante la matriz R = R¿RyR, de rotación en IR3 que representa la 
transformación de coordenadas desde el sistema fijo al sistema móvil, 


cosy  seny 0| |1 0 0 cosp  senp 0 
R=|-sengy cosp 0| JO cosó senO| |[—senp cosp 0| = 
0 0 1| [O —senó cos0 0 0 1 


cos Y cos p — senysenpcosd  senycospcos0 + senpcosy sen y sen O 
—seny cos p — sen(pcosycosó cosycospcosó — senysenp cosypsend | ; 


sen (p sen O — cos psenÚ cos Y 


los ángulos (p, 0, 4 deben escogerse en el intervalo [—-5, 7] y se conocen 


como ángulos eulerianos. Nótese que el determinante de esta matriz es 
det(R) = det(R¿RyR¿) = det(R.¿) det(Ry) det(R¿) = 1. 
Luego, esta matriz es ortogonal. 


La comparación de los elementos de la matriz Ry¿RyR, con las ex- 
presiones dadas en (5.81) permiten obtener esos nueve cosenos en función 
de las constantes (p, 0 y Y. 


Observaciones 

Para determinar los ángulos eulerianos (p, O y 4, se comparan los 
elementos de Q* = [c;;] con los de R¿RygR,¿ (donde las columnas de Q 
son los vectores propios normalizados de la matriz simétrica asociada a 
la forma cuadrática) y se tiene en cuenta que: 


1. Si c33 H% 1, entonces los ángulos eulerianos se pueden determinar de 
la siguiente manera: 
C13 C31 
cos Ú = Cx33, tany =—= y tanp = -=-—Ñ, 
C23 C32 
2. Cuando c33 = 1, entonces 0 = 0 y la matriz de rotación R¿RyR., 
tiene la forma 


COS (w +) sen (y +p) 0 
Ry¿RyR¿= |- sen (1 + p) cos(1 + p) 0|, 
0 0 1 
en este caso, 
tan (Y +) = e 
C11 


Aquí, los ángulos y y ( se escogen arbitrariamente. 
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3. Si la suma de los cuadrados de los elementos de la diagonal principal 
de la matriz de rotación Ry¿RyR., es igual a 1, entonces, el ángulo 
0 satisface que 


2 tan ptan y + y (sec? p + sec? 1p) (sec? p tan? y + sec? y) tan? p) 


cos O = 
1 + tan? ptan? y + sec? p sec? y 


En el último caso, como la tangente de 5 no está definida, cuando 


2 
uno de los ángulos y ó y sea igual a +5, se tiene que 


=== sio > (45) 
> ls 
cos O = tan” eN sec? y) ? Ñ 
si Y => (+2), 


tan? p + sec? p 


y si uno de los ángulos p ó 4 es igual a cero, entonces 


tan q | : 0 
———— sip= 
dei v 1 + sec? y id 
[tan y] h 
si y =0. 


v 1 + sec? p 


Ejemplo 5.23 Determine los ángulos eulerianos de la ecuación cuadrá- 
tica dada en el Ejemplo 5.21. 


Solución. 
La matriz ortogonal asociada a la forma cuadrática era 


-1/V42 1/V3 1/v6 
Q= 0  -1/v3 2/v6 
1/yY2 1/43 1/v6 


Al comparar los elementos de Q* con las de Ry¿RyR,, se tiene que 


1 3 
cosó = —, tany = E tanp = — 
Ji Y ) y p 


Se debe escoger una solución de (5.85) para la cual los ángulos eulerianos 
se encuentren dentro del intervalo [—5, 7] . En este caso, los ángulos 0, y 


y ( valen, aproximadamente, 65%54'18.57", 50%46'6.53" y —26*33/54.18"”. 


(5.85) 


Nr 
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Ejemplo 5.24 Determine los ángulos eulerianos de la ecuación cuadrá- 


tica dada en el Ejemplo 5.22. 


Solución. 
La matriz ortogonal asociada a la forma cuadrática era 


1/46 1/42 -1/v3 
Q=| 1/46 1/42 1/v3 
2/V6 0  -1/v3 


Si se comparan los elementos de (Q* con los de R¿RyR.,, se tiene que 


1 
cos = —- — tany = indefinida y  tanp =1. (5.86) 


ya 


Se debe escoger una solución de (5.86) para la cual los ángulos eulerianos 
se encuentren dentro del intervalo [-5, 21, en este caso, los ángulos 0, y 
y p valen, aproximadamente, 125%15'51.8", 90? y 45. 


5.6.4 Clasificación de las superficies cuádricas 


Para la superficie cuádrica 
ar +by?+c22+4+dxy+ex2+ fyz+gr+hy+iz+j=0, (5.87) 


se establecen las siguientes cantidades 


ll g e w =tr(A), A E 
A=|2 b £l|, p= DY Mil), d= det : 
2 2 v = det A, Ko] 
donde K* = [2 z 5] y w, p, y son los coeficientes de Pa (A). Luego, 


si A1,A2,A3 son los valores propios de A, entonces la ecuación cuádri- 
ca (5.87) representa los siguientes lugares geométricos (L.G.): 
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A1>0,A2 >0,43>0 Un elipsoide 
Un hiperboloide 


d AM >0,A2>0,A3<0 
A A0 j . á de una hoja 
B < o] Un hiperboloide 
vÁA0O A >0,12<0,13<0 . 
de dos hojas 
A1<0,42<0,43<0 Conjunto vacío 
d 0 A1,A2,A3 tienen el mismo signo. Un punto 
po A1,A2,A3 tienen signos distintos. Un cono 
Un cilindro 
A >0,12>0 e 
a elíptico 
L:G: =H0 Un cilindro 
ES v! A1 > 0, A2<0 A . 
I=0 hiperbólico 
v= 
D — 0] A1<0,A2<0 Conjunto vacío 
AE Ó 0 A142 >0 Una recta 
po A1A2 <0 Dos planos que se cortan 
pe 0 A1A2 >0 Un paraboloide elíptico 
A1A2 <0 Un paraboloide hiperbólico 
o) 
S —A1>0 Conjunto vacío 
p=b I=0yH=0 ES 
—A1,<0 Dos planos paralelos 
Di A 0] $ wr y* 
—Á0 y/o HAX%0 Un cilindro parabólico, 
v 
donde 
3 2 
0) ; l 212 0) a l 2112 
=j- (Kw) | = Y) (Kay, 
vV A Ai V ; Ai 
2=1 4=1 
T=XK'ú3, H=Ktú, 


aquí 0, es el vector propio de A asociado al valor propio A;. Cuando d 4 0, 
estas superficies pueden ser clasificadas teniendo en cuenta la inercia de 
la matriz simétrica A como sigue: 


Identificación de las superficies cuádricas 
Inercia Nombre de la superficie 
In(A) = (3, 0,0) Elipsoide 
In(A)=(2,1,0)  Hiperboloide de una hoja 
In(A) =(1,2,0)  Hiperboloide de dos hojas 
In(A) = (2,0, 1) Paraboloide elíptico 
IMA) = (1,11) Paraboloide hiperbólico 
Im A)= (1,0,2) Cilindro parabólico 
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Ejercicios 5.5 
1. Determine la sección cónica y el ángulo de rotación para: 
a. da? + 4xy + y? =09. 
b. 361? + 9y? + 42? — 36 =0. 


c. 2? + 8xy + 16y? — 4x + 16y = 7. 


d. 22 +2xy+y?+20+2y =-1. 


e. 41? — 20xy + 25y? + 4x — 10y =-1. 
f. 4x3? — day +y?-61+3y=4. 


g. 91? — 24xy + 16y? — 201 + 110y = 50. 


h. 6x? + 3y? — 22? + 122 — 18y — 82 =-7. 


i. 22? + 24? + 52? — dy + 202 — 2yz + 10% — 26y — 22 =0. 


2. Sea A la representación matricial de la ecuación cuadrática (5.58) 
con f 40. Sean A y Az los valores propios de A. Demuestre que la 
curva que describe (5.58) es: 

a. Una hipérbola si A1A2 < 0. 
b. Un par de rectas o una parábola si 1142 = 0. 


c. Un circulo, elipse o sección cónica degenerada si A1A2 > 0. 


3. Sean: 


S] 
¡Nk 
ES 
NIK 


A = y B=| y 


nio 
e) 

wie 
Q 


demuestre que si 2 = 2, entonces AB = BA. 
a=cC T-2Z 


Capítulo 6 


Formas hermíticas 


En el capítulo anterior se desarrolló la teoría para formas cuadráticas 
con matriz asociada simétrica real. En este capítulo se consideran for- 
mas cuadráticas pero con matriz asociada compleja. Se estudia el caso 
complejo independientemente del caso real, ya que si se asume X € C? 
y se obtiene la expresión A = X*X, de manera análoga al producto 
escalar estándar de ¡R?, se llega a resultados ilógicos. Por ejemplo, para 
el vector no nulo X* = (a, bi), se tiene que 


XX =0 +0? = a? -—0?; 


este producto puede ser cero si a =bÓ a = —b, hecho que contradice 
la propiedad (v) del producto escalar estándar en R” (ver Capítulo 1). 
Este hecho induce a la redefinición de formas cuadráticas para el caso 
complejo. 


6.1 Forma hermítica 


Definición 6.1 Forma sesquilineal 
Sea V un espacio vectorial de dimensión finita sobre el cuerpo com- 


plejo C. Una forma sesquilineal es una función g : Vx V=C tal que 


(0) g(añ, + Búz, U) == ag(ú,, v) + Bg(ú2, U) 
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(ii) g(ú, au + Bu) =- ag(ú, 51) + Bali, da), 


donde a, PB E C y us, 0 E V. 


Como en la Definición 5.1, la condición (14) se interpreta como que g es 
lineal en la segunda variable. Por otra parte, expresamos la condición (1) 
diciendo que g es lineal conjugada en la primera variable. En el resto de 
esta sección se omitirá el adjetivo “sesquilineal”, salvo que sea importante 
tenerlo en cuenta. 


Definición 6.2 Sea y : Vx V —= C una forma sobre V, entonces y es 


hermítica, si para todo U, w E V, se cumple que: 


g(v, ú) = g(w), U). (6.1) 
Ejemplo 6.1 Sea g : C” xC"” —=R definida por 
AX, Y) = HE AP, 


donde X Y Y e cr y Á es una matriz hermitiana. Verifique si la apli- 
cación y define una forma hermítica sobre C”. 
Solución. 
(i) Para todo X,, X2 y Y € C”, se tiene que 
(1 +X2,Y) = (1 +X2) AY = (XP +X2) AY 
— XEAY + XEAY =g(X,,Y) + 9(Xo, Y). 
(13) Para todo P € C, X y Y € C”, se tiene que 
g(X,pY) =X"A(BY) = 6X" AY 
=8BX AY = PBg[X, Y). 


Así, la aplicación y es lineal en la segunda variable. Además, 


(AY) = (H4AP) = (HHAD] =PEAUZ =PEAX =g(7,X). 


Por lo tanto, g es una forma hermítica sobre C”. 
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Teorema 6.1 Sean V un espacio vectorial complejo y g una forma ses- 
quilineal sobre V tal que g(u, u) sea real para todo ú € V. Entonces, y es 
hermítica. 

Demostración. 


Sean u,v € V y g una forma sesquilineal sobre V tal que g(u, u) sea 
real para todo ú € V. Se debe probar que g(u, 1) = g(u, u). En efecto, 


) = g(u, u) + g(u, u) + g(0, u) + glo, v). 


<! 


g(U+vUU+ 
Como por hipótesis g(U+U,U+), g(u, u) y g(v, 0) son reales, el número 
g(uú, 1) + g(v, u) es real. De manera análoga, se tiene 
g(ú +10, U +10) = g(u, u) + ig(u, 0) — ig(u, u) + g(o, y). 


Por el mismo razonamiento anterior, vemos que ¿g(u, 0) — ig(U, U) es re- 
al. Al concluir que estos dos números son reales, se pueden igualar sus 
complejos conjugados y se obtiene 


) + g(8,ú) = g(u, 6) + g(0, ú) (6.2) 
) — ig(5,ú) = —ig(ú, 0) + ig(0, ú). (6.3) 


Al multiplicar (6.3) por (—¿) y sumarla a la expresión (6.2), se llega a 


29(1, 5) = 210,1). 


Por lo tanto, se satisface (6.1). Mm 


Teorema 6.2 Sea V un espacio vectorial de dimensión finita sobre C. 
Sea g una forma hermitiana sobre V. Entonces, existe una matriz única 


hermitiana A, tal que para todo U,U € V, 
Sa o Ha> 
gA(U, U) =U” Av. (6.4) 
Demostración. 


La prueba es completamente análoga a la del Teorema 5.1 y se deja 
como ejercicio para el lector. Ml 


302 6. Formas hermíticas 


Teorema 6.3 Identidad de polarización 
Sea g una forma hermitiana sobre un espacio vectorial complejo V, 


entonces para todo u,v € V, se cumple que 


gA(U+,8 +0) gA(ú v,U 0) =2|gA(ú, 6) + ga(0, u)). (6.5) 


Demostración. 
La verificación de esta identidad se hace en forma trivial, solo desa- 
rrollando el miembro izquierdo que aparece en (6.5). Mm 


Teorema 6.4 Sea V como antes. Si y es una forma hermitiana tal que 


> 


ga(ú,U) =0 para todo U € V, entonces A= O. 


Demostración. 
Por el Teorema 6.3, para todo u, Y € V, se tiene que 


> 


ga(ú + 0,8 +0) — ga(U— 0,8 — 0) =2|g4(U,0) + ga(o, u)]. 


Luego, si g es tal que ga(1, 1) = 0 para todo U € V, el miembro izquierdo 
de la identidad de polarización es igual a 0, de donde se obtiene que 


gA(U, 0) + 9A(U,u) =0, (6.6) 
para todo u, y € V. Si se reemplaza u por ¿4, entonces se tiene que 
ga(iu,0) + 9a(0,18) = —iga(u, 0) +94 (0,0) =0. 


Así, 
—gaA(ú, Uv) + ga(u, u) =0. (6.7) 


Si se restan las relaciones (6.6) y (6.7), se obtiene 
294 (au, v) =0. 


Por lo tanto, ga(u,U) = 0. Luego, A= O. Como se quería demostrar. M 


Teorema 6.5 Una matriz compleja A de tamaño n x n representa una 


forma hermítica si y solo si es una matriz hermitiana. 
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Demostración. 

Supóngase que A es hermitiana. Como para todo Xx, Y € C”, la 
matriz XY AY es una matriz de 1x 1, es decir, un elemento de R, entonces 
es igual a su propia transpuesta conjugada. Por lo tanto, 


XHAY =(XHAY) = Y:AtX =Y HABER =YPHAX, 


así que Á representa una forma hermitiana. 
Recíprocamente, supóngase que A representa una forma hermítica; es 
decir, 


ga(X,Y) =ga(Y,X), (6.8) 


para todo E Y € C”. Como 


ATA) =VHAR (PIAR) A, (69) 
al comparar (6.8) y (6.9), se tiene que 
yal Y) = CAF <A Y, (6.10) 


Como (6.10) se cumple para todo xs Ye C”, se concluye que A = A*, 
es decir, A es hermitiana. E 


6.2 Forma cuadrática compleja 


En esta sección se estudian las formas cuadráticas F (X l= XHAX, en 
donde A es una matriz compleja de tamaño n x n y la variable X se 
escoge en C”. Como en la práctica, generalmente uno solo se preocupa de 
las formas cuadráticas F' ed l= X'" AX que toman únicamente valores 
reales, en este apartado se asumirá que la matriz A asociada a la forma 


> 


es hermitiana. Cabe notar que en los casos en que F(X) es compleja, por 


> 


lo general solo se puede estudiar la parte real de F(X). 


Definición 6.3 Forma cuadrática compleja 
Sea V un espacio vectorial de dimensión finita sobre los números com- 


plejos. Sea g : Vx V —= R una forma hermítica sobre V. Entonces, una 
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forma cuadrática hermítica o forma cuadrática compleja determinada por 


g es una función F' : V — RR, tal que 
F(5) = ga(5,0) = 04 Av. (6.11) 


La matriz A se llama la representación matricial de la forma cuadrática 


compleja. 


Ejemplo 6.2 Producto hermítico canónico 
Sea V = C” y considere la forma cuadrática compleja determinada 


por el producto escalar sobre C”: 
P(0) =|418 +21? +... +!|zp/?, 


donde |2;1? =7;2;. Exprese esta forma cuadrática compleja como 04 AG. 


Solución. 
Vamos a determinar la matriz compleja A = [a;¿] de la forma hermíti- 
ca g, de tal forma que 


n n 
Ni HA = a: 
F(ú) = 0" Av= y ) Oigo (6.12) 
¿=1j=1 
Es decir, se quieren encontrar los valores de a;;, de manera que 
n n n 
y y — > 2 
Oj Zi25 = LA . 
2=1 j =1 i=1 


Como la matriz A es hermitiana, a;; = aji. Por lo tanto, la forma cuadráti- 
ca compleja dada en (6.12) se puede expresar como 


n n n-=1 n n-=1 n 
) ) da = y as 2]? + ) ) dia ) ) a 2427, (6.18) 
i=1j=1 i=1 i=1j>1i i=1 j>1 


y sl se comparan términos, se establecen las siguientes relaciones: 


n-=-1 n n-=1 n 


n 
Y aji? 0 > [241 y ES Y ias + ys Nu zi23 =0. 


i=1 a=I i=1 j>1i 1=1:3>% 
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Pero como en la función F(%) no aparecen términos de la forma 2;2;, 


entonces 
o l si2=J, 
210 5:27 


Luego, A = 1, y, por lo tanto, F(5) se puede expresar como 0" 1,5. 


Ejemplo 6.3 Sea V = C* y F(X) = lx11? — ¿21x2 + ¿2211 — 7123 — 
7311 — 21213 + 21319. Exprese esta forma hermítica como XHAX. 


Solución. 
Si se utiliza el resultado obtenido en (6.13), para n = 3, se tiene que 


3 2 3 2 3 
i=1 i=tgsi i=1j>i 


Al resolver esta suma y comparar los a;; con los coeficientes de la función 


> 


F(X), se obtiene la matriz 


il. =+ -Í 
A=|l¿i 0 -25l, 
1H 0 


la cual permite expresar a F E ) de la forma HAZ, 


6.3 Diagonalización de una forma hermítica 


Teorema 6.6 Sea FE(X) una forma cuadrática compleja asociada a una 
matriz hermítica A. Sea L una matriz compleja triangular inferior tal que 


A se pueda factorizar como LDL*. El cambio de coordenadas 
A=L"X (6.14) 


transforma a XHAX en ZHDZ. 
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Demostración. 
La matriz A asociada a la forma se puede factorizar como 


A = LDU. 
Como A es hermítica, por el Teorema 3.5, U = L*. Por lo tanto, 
XPAX =X* (LDL) X puesto que A= LDL” 
== (FDIDIESX) 
= LEX = Z*DZ puesto que Z=L YX. 


Así, queda probado el teorema. Mi 


A continuación, se presenta una versión de este método de diagonaliza- 
ción: 


Procedimiento para diagonalizar una forma hermítica 


> 


1) Halle la matriz de coeficientes hermítica A asociada a F(X). 


ii) Obtenga la descomposición LDL* de A sin efectuar inter- 
cambios de filas que destruyan el hecho de que a;; = aj; y con 
elementos en D = diagíd¡1,d22,...,dnn) tales que di; € R 
no necesariamente distintos de cero. Además, det(L) = 1. 


111) Transforme a FX) en d111211?+d22|2212+...+dnnlzn1?, bajo 
el cambio de coordenadas Z = LY X. 


Ejemplo 6.4 Considere la ecuación cuadrática compleja: 


|x11? — 11129 + 1191] — 123 — X301 — 2112913 + 212319 = 9. (6.15) 


Encuentre una diagonalización para esta forma hermítica, usando el mé- 


todo descrito anteriormente. 


Solución. 
En el Ejemplo 6.3, se obtuvo que la forma cuadrática hermítica aso- 
ciada 


[21 1? 1119 + 12921 — T]T3 — T311 — 211923 + 217319 
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se puede expresar matricialmente como 


tt A 7 a 
XYAX =[5 3 m3 | i 0 -2l lx 
-1 2 0]|lz 


(6.16) 


La factorización LDL* de la matriz asociada a la forma hermítica es 


1 — -—1 1 0 0|¡1 0 0[|1l — —1 
1 O —2|=| + 1 0/0 —1 0O[| JO 1 ls 
-1 2 0 -=1 — 1||0 O O0O[J0 0 1 
de modo que 
l — 3 —1 
MN =X* | 0 —2|X 
-1 2 0 
1 0 f1 0 0| [1 —2 —1 
= | dl 0 -1 0|[0 1 ¿|X 
-=1 — 1 |0 O 0O[|J0 O 1 
si se hace 
21 1 —¿ -1 
Z¿=lpe|=i*X=[0.1 41% 
23 0 0 
Nótese que det(L) = 1. Por lo tanto, el cambio de variables 
21 =U1—U2— Ya, 22 = 12 + 123 y 23 = X3 


> 


permite expresar a F(X) de la siguiente manera: 
F(Z) = |211? — [22]? =9, 
y al reescribir (6.15), se tiene que 


[211? — [2]? =9, 


la cual corresponde a la ecuación de una “hipérbola” sobre los ejes 21 y 


22. 
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Teorema 6.7 Teorema de los ejes principales 
Sea F(X) una forma hermítica asociada a una matriz hermitiana A 
con valores propios (no necesariamente distintos) A1,A2,..., An. Sea U 


una matriz unitaria que diagonaliza a A. El cambio de coordenadas: 
X=UZ (6.17) 
transforma a XHAX en ZEDZ, donde la matriz diagonal 


D=UFYAU = diagíM,A2,..., Ant. 


Demostración. 
La demostración consiste en un cálculo directo 
XP AX =(UZ)PA(UZ) puesto que X =UZ 


= (2% UF A(UZ) 
== zZ“(u* AU)Z =Z*DZ puesto que U diagonaliza a A. 


m 
A continuación, se presentan los pasos a seguir para determinar la diago- 
nalización de una forma hermitiana mediante este método: 


Procedimiento para diagonalizar una forma hermítica 


> 


¡) Halle la matriz de coeficientes hermitiana A asociada a F(X). 


11) Encuentre los valores propios (no necesariamente distintos), 


du Moss Ag de A: 


113) Encuentre una base ortonormal para C” formada por los vec- 
tores propios normalizados de A. 


¿w) Forme la matriz U cuyas columnas sean los vectores de la base 
hallada en el paso 121) en el orden correspondiente al listado de 
los valores propios en el paso ¿1). La transformación X=UZ 
es una rotación si || det(U)|| = 1. 


v) Transforme a F(X) en A1|2112 + Aolzo]? +... + Anl2nl?. 
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Ejemplo 6.5 Considere la ecuación cuadrática compleja dada en el 
Ejemplo 6.4. Determine la “superficie” cuadrática obtenida al eliminar 


los términos de productos cruzados. 


Solución. 
En el Ejemplo 4.6, se obtuvo que la matriz A asociada a la forma 
cuadrática compleja era diagonalizable mediante la matriz unitaria 


1/43 0 2/V6 
U=| i/Vv3  1/v2 -i/v6 
1/43 -i/Y2 1/V6 


Luego, 
3. 0.0 
UFAU=|0 -2 0 
0 0.0 


Por consiguiente, (6.16) se puede escribir en términos de las nuevas va- 
riables 21,22, 23 como Z*DZ, es decir, 


3|21 1? — 2/20]? =9, (6.18) 


21 1/43 —¿/43 -1/V3 71] [x, 
Z=|lx|=U*BX=| 0 1/42 ¿/v2 | |x2l, (6.19) 
23 2/46 i/vV6  1/v6 | |u3 
y reescribiendo (6.18), se obtiene 
1 
9/ 


la cual corresponde a la ecuación de una “hipérbola” sobre los ejes z¡ y 


1 2 2 
=1 
3141! 7122! l 


22. 


Definición 6.4 Forma polar de una forma hermitiana 
Dada F una forma cuadrática compleja, se puede obtener una forma 
hermítica y de F' de acuerdo con la siguiente identidad llamada la forma 


polar de g: 


[F(ú+0) - F(u— 0) + ¿[F(i+ 40) — F(a— 10). (6.20) 
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6.4 Clasificación de formas cuadráticas comple- 
jas 
Definición 6.5 Una forma cuadrática compleja FLO) = XHAX asocia- 


da a una matriz AF O, es 
1. Definida positiva si F(X) > 0 para todo X 4 0 en C”. 
2. Definida negativa si F(X) < 0 para todo X + 0 en C”. 
3. Indefinida si FX) asume ambos valores positivos y negativos. 
4. Semidefinida positiva sí F(X) > 0 para todo X € C”. 
5. Semidefinida negativa si F(X) < 0 para todo X € C”. 


La matriz hermitiana asociada A se denomina definida positiva, semidefi- 
nida positiva, definida negativa, semidefinida negativa o indefinida según 


sea la forma cuadrática compleja FX) que define. 


Ejemplo 6.6 Verifique si la forma hermítica dada en el Ejemplo 6.2 es 


definida positiva. 


Solución. 
La forma F(%) dada en el Ejemplo 6.2 es definida positiva ya que para 
todo 1% 0: 


n n 
== aa => la? >0, 


i=1 i=1 


donde YE = (21,20,...,29)* y 24 € C. 
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6.5 Orden parcial entre matrices 


Dadas dos matrices, además de combinarlas haciendo operaciones entre 
ellas (suma, resta, multiplicación), las podemos comparar para ordenarlas 
o clasificarlas. Una comparación que surgió en secciones anteriores fue ver 
si eran semejantes. En esta sección se hablará de un orden “parcial” entre 
matrices semidefinidas positivas. 
Definición 6.6 Orden entre matrices 

Sean A y B matrices hermitianas de tamaño nxn. Se escribe A 5 B si 


la matriz A — B es semidefinida positiva. Similarmente, A > B significa 


que la matriz A — B es definida positiva. 


Teorema 6.8 Si A y B son matrices hermitianas de tamaño n X n, 


entonces: 
A PB implica que TEATS TF BT 


para toda T' € Mnn. 


Demostración. 
Si A— B es semidefinida positiva, entonces Y Y (A - B)Y > 0 para 
todo Y € C”. Así, 


UTE AT - TEBA = (O "(AB (TX) 20 


para todo XE C”, lo cual, a su vez, significa que THAT pp TPUBT. 0 


Corolario 6.8.1 Si A y B son matrices de tamaño n xXx n definidas po- 


sitivas, entonces: 


a) Si A 7 B, entonces Ag(A) > Ax(B) para todo k=1,2,...,n si los 
respectivos valores propios se colocan en el mismo orden (creciente 


o decreciente). 
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b) Si A 7 B, entonces det A > det B y tr(4) > tr(B). 


c) A> B si y solo si B=! > A7!. 


Demostración. 
Queda como ejercicio para el lector. M 


Ejemplo 6.7 Dadas las siguientes matrices: 


FS 221 
A= IL 7: y B=H|2 5 2l, 
2 210] 193 


muestre que A es más positiva que B. 


Solución. 
Primero, se obtiene la matriz C = A— B: 


5 —1 1 
C=|-1 2 0 
al 0 8 


Los valores propios de esta matriz son 
A =5, A =5+vV11, Az =5-—vll, 


como todos los valores propios son positivos, entonces C' es definida po- 
sitiva y, por lo tanto, A es más positiva que B. 


Ejercicios 6.1 
1. Reduzca las siguientes formas complejas a una forma diagonal: 


a) 2211? + (1—)7122 + (1+1)7201 + 3]221? =4. 


b) l211?— ¿3112417321 +71123 + 7311 —119%3+11319 2|23/? — E 
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. Considere las matrices asociadas a cada una de las formas cuadráti- 
cas complejas del Ejercicio 1. Determine qué tipo de matrices son 


(definida positiva o definida negativa). 


. Sea A una matriz hermítica cuadrada de tamaño 3 x 3. Supóngase 
que Ay > 0, Az <0 y Az > 0. Muestre que A tiene un valor propio 


positivo y dos negativos. 


. Sea A cualquier matriz compleja no singular. Muestre que B = 


AP A es hermítica y definida positiva. 


. Muestre que si Á es una matriz hermítica cuadrada de tamaño n xn 
definida positiva con valores propios A1 > A2 >...> An >0y B 
es una submatriz principal de A de tamaño k x k, entonces 
k k 

II An—¡+1 £ det B < II Ago 

j=1 j=1 
. Sean A y B matrices hermíticas cuadradas de tamaño n x n con 
valores propios A1 > A2 >... > An y 11 > M2 >... > in, Tespec- 
tivamente. Sean 01 > 09 > ... > On los valores propios de 4 + B. 


Para 1 < k < n, demuestre que 


máx Az + fin, An + x) < 0% < máx Az + 41, A1 + 4). 


Capítulo 7 


Normas matriciales 


En este capítulo se intenta medir la sensibilidad o la “vulnerabilidad” de 
la solución de un sistema no singular de ecuaciones lineales AX =b. En 
otras palabras, se quiere medir qué tan grande es el efecto en X=A5b 
si se cambian ligeramente las componentes de A y b. Es decir, se debe 
encontrar una manera de medir el cambio AA y definir la “longitud” de 
una matriz, pues para vectores ya sabemos cómo obtener su longitud y 
ahora necesitamos un concepto análogo para matrices. 


7.1 Definición y resultados básicos 


Definición 7.1 Norma de una matriz 
Sea Mnn el espacio de las matrices de tamaño n xn con componentes 
reales (complejas). Una norma de matriz ||-|| de Man en R es una función 


que satisface para toda A, B € Mm los cinco axiomas siguientes: 


(1) 14] > 0 No negativa 
(2) [AI] =0 si y solo si A=0 Positiva 
(3) IIcAll =|c|IL4]] para todo escalar c Homogénea 


315 


316 7. Normas matriciales 


(4) 14 + Bl < 114] +11Bl Desigualdad triangular 
(5) ABI] < [141 [1 Bl Submultiplicativa. 
Teorema 7.1 Sea || - || cualquier norma matricial, entonces: 


1. ln !| > 1, donde I,, es la matriz identidad de tamaño n x n. 


para cualquier matriz A € Man no singular. 


3. | AF < [LA]]* para cualquier matriz A € Mnn y todo k > 2. 
Demostración. 
1. Queda como ejercicio para el lector. 
2. Puesto que A47! = [,,, entonces 
IZ 1 == 447% < [AI NAT! por propiedad (5). 
Pero como ||A|| > 0, se tiene que 


TA 
[4 


[A > 


3. La demostración es por inducción sobre k. El resultado es trivial 
para k = 2, puesto que por la propiedad submultiplicativa 


[14% < 11411 11411 = [1.41f. 
Supongamos que se ha demostrado para cualquier k = m, es decir 
47] < [14]]”. 


Luego, [147+1|] = [47 A]| y, por la propiedad submultiplicativa, 
se tiene 


ATA] < [ATINA]! < LANA] = (1411772. 
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7.2 Tipos de normas matriciales 


Las normas que se consideran en esta sección son algunas de las normas 
que se pueden emplear en el espacio de matrices Mp análogas a las 
normas de los espacios vectoriales. 


Teorema 7.2 Norma Li; 


Dada la matriz A = [a;;], la función || - || : Mann — R definida por 
n 
Alla = Y Jas! 
ij=1 


es una norma de matriz. 


Demostración. 
Los axiomas de (1) — (3) se satisfacen fácilmente de la definición de 
valor absoluto, se demostrará, por lo tanto, que se cumplen los axiomas 


(4) y (5). 


(4) Para la desigualdad triangular se tiene 


n n 
14+ Bl = Y > las; +bi5] < Y  (lasj] + [bi5)) 
ig=1 ij=1 
n n 
= Y > lag + Y > 10551 = (Alla + 1Bl1- 
ij=1 ij=1 


Por lo tanto, se cumple el axioma (4). 


n 
(5) Puesto que AB =C = |c;¡] = Y, Qix by, entonces 
k=1 


n n n n 
4B]_ = Y [Y 05 ba¡| < Y lei dio] € Y (te dom! 
.j=1lk=1 tsf=1l ¿,j/kym=1 
n n 
- » e] | S fomal| = All 1» 
¿k=1 jym=1 


En la verificación de este axioma, la primera desigualdad se obtiene 
de la generalización de la desigualdad triangular y la segunda, de 
los términos adicionales a la suma. 
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Por consiguiente, [|A||¡ sí es una norma matricial. Ml 


Ejemplo 7.1 Norma euclideana (La) 


Determine si la norma La definida por 


n 5 
4]l2 = y bs?) 


2Jy=1 
es una norma de matriz. 


Solución. 
Fácilmente se puede probar que los axiomas de (1) — (3) se satisfacen. 
Por lo tanto, veamos si se cumplen los axiomas (4) y (5): 


(4) 114+ BIS =D> lai¡ +01? < Y (lasj]? + 20551 [bi] + [0,51?) 


ij=1 ij=1 
n n n 
S y la;¿|? +2 y las; di5| + Y 10,51? 
ij=1 ij=1 ¿j=1 
1 1,39 
n 2 n 2 
<|( DS as?) ER (E bar) | 
¿j=1 ij=1 
2 
= (1All2 +1 Bl/2)*. 


Luego, se cumple el axioma (4). 


n 
y Ok Dr; 


k=1 


n 


2 n n n 
(5) ABI = Sy 165 bu) (E bmi?) 
ij=1 ij=1LAk=1 m=1 


» y bu) >) bra?) = Aé 1813. 


ik=1 jym=1 


Esta desigualdad es justo la desigualdad de Cauchy-Schwarz. Por consi- 
guiente, || - [l) sí es una norma. 


Ejemplo 7.2 Norma Lo, 


Determine si la función || - || : Man — R definida por 


Allo =nN máx |a;s| 
1<i,¿<n 
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es una norma de matriz. 


Solución. 
Los axiomas de (1) — (3) se satisfacen fácilmente de la definición de 
máximo. Se probará si se cumplen los axiomas (4) y (5): 


(4) (14 + Blloo A las; + bi¿] < a (la;;| + [b55l) 


=n máx , 07) + máx , ig| = = ll Alloo + || Blloo- 
1<1,j< 1<3,j< 


Por lo tanto, se cumple el axioma (4). 


y Ok br; 


<n y, Ele Bl — fo 11! 


Ni 1<ijon $ 


(5) (AB lo =m máx 


n 
<n máx Y (ask dyj| 
1<1,j< 


EA 


Por consiguiente, ||A|| sí es una norma. 


Definición 7.2 Norma matricial inducida 
Sea || - || una norma vectorial sobre C”. Se define || - [|;,, sobre Mnn 


por 


(7.1) 


Allin = máx [47 ]] = máx 47. 
lkzIl =1 220 (17 


Las letras “im” en la norma es la abreviación de la frase “norma inducida”. 


Teorema 7.3 Norma espectral 


La norma espectral || - |s se define sobre My por 
As = 01 = máxLo; : 0; es un valor singular de A). (7.2) 
Demostración. 


De la ecuación (7.1), se tiene que 


(Alé, = máx LEE — más 
ETA EE 
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Luego, si A% Af = 022, se obtiene 
o SEAMAR)] PUE] 
A A A 

zA0 TT 140 


como A* A es una matriz hermitiana, sus valores propios son reales. M 


Definición 7.3 Radio espectral 
El radio espectral r(A) de una matriz A € Mnn es definido por la 


cantidad: 
r(A) = máx( [Al] : A es un valor propio de A), 


donde ||A|| es el valor absoluto o módulo de A. 


Ejemplo 7.3 Obtenga la norma espectral y el radio espectral de la ma- 


triz: 


Solución. 
Como la matriz A es simétrica, sus valores singulares y sus valores 


propios son iguales, es decir, 1 = A =4 y 02 = A = 2. Por lo tanto, 


1Alls =4 y r(A) =4. 
Teorema 7.4 Sea A € Man Y ||: || cualquier norma de matriz, entonces: 
r(A) < 141. 


Demostración. 
Supóngase que AY =A7, 7% 0 y que |A] = r(4). Sea X € Mhnn la 
matriz cuyas columnas son todas iguales a Y, entonces AX = AX. Luego, 


si || - || es cualquier norma de matriz, se tiene que 
[AX] < Al! 11X 
[AX] <]/ Al] 11X 


AX] <l 411 117]. 


Por consiguiente, ||A]| =7(4) < [A]. mn 
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Ejercicios 7.1 


1. Calcule para cada una de las siguientes matrices la norma espectral 


y el radio espectral: 


1 1 1 1 E <= 
a b. C 

=1 3 3 —i il E 

13 —3 3 -1 4 
del 1 4 e [A 1 <<=5 

<= t 4 Ss 3 2 


2. Muestre que A y A? tienen el mismo radio espectral y la misma 


norma, espectral. 


3. Si A es una matriz simétrica de tamaño n xn, muestre que su norma 


espectral coincide con su radio espectral. 


4. Si A es una matriz hermitiana de tamaño n x n, muestre que la 


norma espectral y el radio espectral son iguales. 


Teorema 7.5 Lema de Banach 
Sea A una matriz real de tamaño nx n y sea ||- || una norma matricial 


sobre Man. Suponiendo que [|A|| < 1, entonces [, — A es no singular y 


a sl” s 71 


Demostración. 

La matriz [,, — A es no singular si y solo si la única solución del sistema 
homogéneo (Laa —- A)Z = 0 es  =0. Suponga entonces que (dl =- Az =0 
de modo que Y = Ax. Entonces, se tiene que 


[7] = 147] < 1411/11. 
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Pero como ||A|| < 1, entonces hay una contradicción a menos que 7 =0, 

A E E A 
como se ha tratado probar. Así que (Leo — A) existe, se denotará con 
R. Luego, 


In =R(I,— 4) =R-RA. (7.3) 
Por lo tanto, 
1 = |, = [RG — Ml] < 1245 +64)! < 1211 (+ 114], 


de manera que ||R|| > 1/ (1 + [14])) como se afirmó. De la expresión (7.3), 
R = In + RA, así que 


[RI] = [|£, + RA]| < 14 [1RA]| < 1 + [RINA]. 


Por consiguiente, | R]| < (1 — An, lo cual completa la prueba. Ml 


Ejemplo 7.4 Para la siguiente matriz: 


1 11 —6 
8 9 


determine las cotas superior e inferior del lema de Banach. 


Solución. 
La matriz A se puede escribir como A = [ — B, en donde 


1 [-1 56 
B=b > ql 


Como se puede emplear cualquier norma matricial, usando la norma es- 
pectral, se tiene que 


742 
Blls = Íl!; 
¡Bs = EL < 
El lema de Banach dice que A =/ — B es no singular, y por lo tanto 


15 Vs < 
17+ 42 — $ 3-y2 
El lema de Banach dice que matrices suficientemente “cercanas” a 


[,, son no singulares. El teorema siguiente es una generalización de este 
hecho. 
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Teorema 7.6 Inversas perturbadas 

Sean A y B matrices de tamaño n xn siendo A no singular y sea || - || 
una norma matricial sobre Man. Defínase a. = [A Bl oQq= [BA : 
Sia < 1 (es decir en especial si Bl] < 1/47), entonces A— B 
también es no singular y 


[4] 
l1+0 


[LA] 


Le 


<|ra-0r< 


Demostración. 
Supongamos que [A Bl < 1. El otro caso es semejante. Como 47! 
existe, se puede escribir A — B como 


A (1, - A?*B)=A(1,—B), 


donde R = A7!B. Por hipótesis, [|R|| = «a. < 1, de modo que al aplicar 
el lema de Banach, se obtiene que f,, — R es no singular, como lo es 4. 
Luego, 


A(I, —R) =A-B (7.4) 


es también no singular y 


(A-B)"=[41H-R]”"=(.-R "A. 


Por lo tanto, 


E E 


Por el lema de Banach, esta es la cota superior que se deseaba. Para 
obtener la cota inferior, se reescribe (7.4) como 


AT! = (Tn —R)J(A-B)7, 
de lo cual se deduce que 
[47] < 2 RI [4 — B| < 1+0) [ta - By” 


Al dividir por (1 + a), se obtiene la cota inferior que se buscaba. Ml 
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7.3 Condición de sistemas de ecuaciones lineales 


El concepto de condición es importante en todas las matemáticas apli- 
cadas. Si “pequeños cambios en los datos” de un problema producen cam- 
bios razonablemente pequeños en su solución, se dice que el problema 
está bien planteado. Si “pequeños cambios en los datos” de algún proble- 
ma ocasionan cambios inaceptablemente grandes en la solución, se dice 
que el problema está mal planteado. La razón de la importancia de este 
concepto debería ser evidente: en los problemas aplicados, casi siempre 
los datos son inexactos por errores de medición y de modelamiento, y es 
crucial conocer los efectos que tienen las inexactitudes en los datos sobre 
la solución del problema. 


Definición 7.4 Sistema de ecuaciones de mal comportamiento 


Un sistema de ecuaciones lineales 
AX =b (7.5) 


con A una matriz de tamaño nx n, X € R” Y be R”, se dice que 
es un sistema de mal comportamiento si las n columnas de la matriz 
son casi linealmente dependientes o, en otras palabras, si la matriz de 
los coeficientes es casi singular. Esto significa que un cambio pequeño en 


algunos elementos de A produce una matriz singular. 


Definición 7.5 Número de condición 
Sea A una matriz no singular real de tamaño n x n, el número de 


condición se define como 


= Cmazx 
s(4) = VAIs1A“ls = Pee 16) 


main 


donde, max Y min son los valores singulares más grande y más pequeño, 


respectivamente, asociados a A. 
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Teorema 7.7 Sea A no singular y sea || - || una norma matricial sobre 


Mmnn- La sensibilidad de la solución de un sistema de ecuaciones lineales 
Ar=b 


con respecto a la perturbación AA en A se relaciona directamente con el 


número de condición. En otras palabras, si 


7 resuelve a (A+A4)7 =b. 


en donde a: = ||¡AA]| / [| A|| es el error relativo en A. 


Demostración. 
Puesto que la solución del sistema perturbado es y, entonces 


Luego, si || - [| es cualquier norma matricial, se tiene que 
lg— || = ||-4A4g]| < [4 AA 13 
< [4]144] 11311, 


como se quería. Mi 


Ejemplo 7.5 Resuelva el sistema de ecuaciones: 


(1+011+xu =2, 21 +23 =1l, 
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cone ER y en las fórmulas que obtenga para 11 y 12, sustituya: 
(1) e =0.01,0.02 y (12) e =2.01,2.04. 


Compare los cambios en porcentaje del coeficiente de xi en la primera 
ecuación, en los casos (1) y (11), con los cambios en porcentaje de la 


correspondiente solución de 211. 


Solución. 
Aplicando el método de eliminación de Gauss, se obtiene 


l+e 1 | 2 e 0 | 1 
i a ]alasa li 1.1" 


Esto conduce a 11 =1 y 12 =1-—1, (e 4 0) 


E? 


(1) (14) 
e 0.01 0.02 2.01 2.04 


Solución | (100, —99) | (50,49) | (12,2) (2,2%) 


El cambio en porcentaje del coeficiente de x, es 1% con una cifra decimal 
en Cada caso. 

La solución de x1 en (1) varía en un 50% y en (4) en un 1.47 %. Esto indica 
que cuando e es pequeño, las “ecuaciones son de mal comportamiento”. 


Un modo sencillo de probar si un sistema de ecuaciones es de mal 
comportamiento consiste, precisamente, en proceder como lo hicimos en 
el ejemplo anterior, esto es, efectuar un pequeño cambio en algunos co- 
eficientes para ver qué efectos se producen en la solución, pero esto es 
difícil de hacer cuando se trata de un sistema de ecuaciones muy grande. 
Existe un método que nos da una indicación de cuándo se presenta el mal 
comportamiento, usando la Definición 7.5. 

El número de condición nos da una regla práctica para determinar si 
un sistema de ecuaciones es de mal comportamiento: 


Si 0 <k(A) < 100 siempre el sistema es bien condicionado, 
100 <k(A) < 1000 a veces el sistema es mal condicionado, 


1000 <k(A) siempre el sistema es mal condicionado. 
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Ejemplo 7.6 Determine el número de condición de la matriz asociada 


al sistema de ecuaciones del ejemplo anterior. 
Solución. 
Como la matriz asociada al sistema es simétrica, su norma espectral 


coincide con su radio espectral; luego, se necesitan los valores propios de 
la matriz A. En este caso, el polinomio característico de A es 


PA) == dté 
de donde los valores propios son 
1 1 1 1 
A LN 4d +e y o e 

Luego, el número de condición de la matriz A es 

1 1 1312” 

A 1 (5 ) 

(A) (1430 + (597) 


Para los valores de e dados en el Ejemplo 7.5, se tiene que 


«(A) | 402.01 | 202.02 | 5.8285 | 5.8292 


Ejemplo 7.7 Suponga que la matriz de covarianza de un experimento 


con tres variables 11,19 Y T3 €s: 


4 1 1 
1 
S== 
10 13 2 
123 


Encuentre el número de condición. 
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Solución. 

Como S es simétrica, entonces su norma espectral coincide con su 
radio espectral; por lo tanto, se necesitan los valores propios de la matriz 
S. En este caso, el polinomio característico de S es 


27 9 
— 34092 
PSA) = FAC Ig op: 
de donde los valores propios son 
3 3 1 
A =+=w A ==> As ==» 
1 5 > 2 10 y 3 10 
Luego, el número de condición es 
A 3/5 
AV == 
dido ii a /10 


Como (A) es pequeño (< 100), significa que cambios pequeños en los 
datos producen cambios razonablemente pequeños en la estimación de la 
matriz de covarianza. 


Teorema 7.8 Sea A no singular y sea || - || una norma matricial sobre 


Mhnn- La sensibilidad de la solución de un sistema de ecuaciones lineales 
Ar=b 


con respecto a la perturbación Ab en b se relaciona directamente con el 


número de condición. En otras palabras, si 


Ay = b+ Ab con <a, 


Bl 


entonces el cambio en la solución satisface que 


ly 1 < ax(A), 
[|] 


en donde a: = ||¡AA]I| / [| A|| es el error relativo en A. 
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Demostración. 
Puesto que la solución del sistema perturbado es y, entonces 


Luego, si || - || es cualquier norma matricial, se tiene que 
Iz— 21 = || 4A5]| < [14] las] 
< a [47 || [15]. 
Pero como b= AF, se tiene que ||b]] < [| 4]| [7] . Entonces, 
y — 7] <ax(A) [2]. 


Así, se completa la prueba. MM 


Definición 7.6 Indice de condición 
Sea A una matriz real de tamaño n x n, el índice de condición se 
define como 


IC(A) =4/s(4), (7.7) 


donde «(4) es el número de condición de A. 


Teorema 7.9 Sea A no singular y sea || - || una norma matricial sobre 


Mhnn- Suponga que Y resuelve a Al = b mientras que 
y =I+Az resuelve a (A+ ALM)y=b+Ab, 


para ciertas perturbaciones AA y Ax en los datos. Suponga que la per- 


turbación AA es lo suficientemente pequeña como para que a < 1, en 
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donde a = (4.4) Al 00= A=l (AA)I| . Entonces, el cambio Az en 


la solución satisface 


[AF] _ (4) [45] e AA) 
í 115 NAL)” 


en donde k(A) es el número de condición de A. 


Demostración. 

S10 <a < 1, el Teorema 7.6 implica que A + AA es no singular y 
da una cota para la norma de su inversa. Como A + AA es no singular, 
la solución y al problema perturbado existe. De hecho, AZ resuelve el 
sistema 


(A+AA)AF=b+Ab— AF — AAZ=Ab-— AAZ. 
Denotando B = —AA y despejando AZ se tiene que 
Az=(4-B)” (Ab+Bz). 


Al aplicar la norma a ambos lados y usando al lado izquierdo la cota 
superior dada en el Teorema 7.6, se obtiene que 


(1- a) Az] < 47 [añ+ Bs| 
< 4 (48 + 1181 1311) 
Por lo tanto, al reemplazar B se llega a 


paz a (194 


[Fl — 1=a A II 


EIAA| 
Puesto que b= AZ, esto implica que 115 < [Al ([ZI]. Al sustituir, se tiene 
que 


paz pa (1127) 
la a | 


[A] +44] 


a) (12%, 11341 
=1=a la e Tar] 


lo cual completa la demostración. Ml 


7.3. Condición de sistemas de ecuaciones lineales 331 


Ejemplo 7.8 Considere el sistema de ecuaciones: 
21 + 6x2 =0, 6x1 + 46x9 = 20, (7.8) 


que tiene la solución exacta 11 = —12, 19 = 2. ¿El sistema está bien 


condicionado o mal condicionado? 


Solución. 

Para determinar si el sistema de ecuaciones dado en (7.8) es estable, 
se calcula el número de condición por medio de la ecuación dada en (7.6). 
Si se expresa matricialmente (7.8), se tiene que 


al Ll = bo: 09 


Como la matriz del sistema es simétrica y definida positiva, su norma 
espectral coincide con su radio espectral; por lo tanto, se necesitan los 
valores propios de la matriz A. En este caso, el polinomio característico 
es 


pA(A) = A? — 471 +10, 
de donde los valores propios son 
47 3 47 3 
Amar ==y +7V24 y Amin ==y — 3 V241L, 


Luego, el número de condición es 


(4) = 2moz — =(5+ 2/21) - 


Ami 


6 2 (2180 + 141/241) = 218.9. 


En este caso, como «(A) es muy grande (> 100), se dice que el sistema 
no es estable. 


Ejercicios 7.2 


1. Encuentre para cada una de las siguientes matrices su número de 


condición y una matriz singular cercana: 


11 “rt 3d 
0.89 0.53 1 
a. ¿ b. ¿ e 1L0 —L0 20 
0.47 0.28 0 


[) 


E La 


02 33 1.4 
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2. Si A es una matriz simétrica real de tamaño n x n, muestre que su 


número de condición es 


(A) Aras | 


E [Aaa á 
donde |Amazx| Y |Amin| son los absolutos de los valores propios aso- 


ciados a A más grande y más pequeño, respectivamente. 


. Sea A la matriz: 


1 k ” 1 —k 
A = Ñ por lo tanto A? = 
o 1 o 1 
Si se emplea la norma || - [1 o la norma || - [,,, se obtiene que: 
4) =114%] =2+xk% para as 0 
Luego, el número de condición k(A) = (2+k)? es grande para 


k grande. Sin embargo, si se considera el sistema de ecuaciones 


hb = Ñ se tiene que q = 
1 1 


Mientras que si solo se altera a b por medio de 01, 02 (40) a 


e 1+0 01 — kó 
b= | ; entonces Az = j , : 


+a, ES 


Encuentre una cota para [|AZ]|/[|%]] en términos de ||A5||/|6]| me- 


Si 
+ 
b 


diante la norma 1 o la norma oo para probar que este problema está 
bien condicionado, a pesar de que el número de condición de A es 


grande. 


Capítulo 8 


Matrices idempotentes 
y productos especiales 


En este capítulo se enuncian algunos teoremas concernientes a un tipo 
especial de matriz, la matriz idempotente y algunos productos matriciales 
especiales. En muchas aplicaciones estadísticas? se incluyen este tipo de 
matrices y productos, por ello se dedica este capítulo de manera exclusiva 
al tratamiento de dichas matrices y productos. 


8.1 Definición y propiedades 


En el Capítulo 5, cuando trabajamos las formas cuadráticas, una de las 
condiciones que pusimos fue que la matriz asociada fuera simétrica. En el 
estudio de análisis de varianza, la matriz asociada a la forma cuadrática 
además de ser simétrica resulta ser idempotente (véase Ejemplo 5.5 y 
problema 6 de los Ejercicios 5.1). 


Definición 8.1 Matriz idempotente 


Una matriz cuadrada A se dice que es idempotente si cumple que 


AS áR. 


1 Véase Capítulo 10. 
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Teorema 8.1 Los valores propios de una matriz simétrica e idempotente 


son cero O uno. 


Demostración. 

Si A es simétrica, sus valores propios son reales. Sea A un valor propio 
de A, entonces existe un vector y % O tal que A7 = A7. Al premultiplicar 
ambos lados por A, se tiene que 


Como A es idempotente, entonces 424 = AY = Av, luego 


AU =»M5 
0. 


Pero UH 0, así que A? — A debe ser cero. Por lo tanto, A=00A=1. Mm 
El recíproco del Teorema 8.1 no es cierto, véase el siguiente ejemplo. 


Ejemplo 8.1 Dada la matriz: 


obtenga los valores propios y verifique si At= A y A?=A. 


Solución. 
En este caso, los valores propios de A son A = 1 de multiplicidad 
algebraica 2 y Az = 0. Pero 4? 4% A y 4? 4 A, ya que 


A Y 1.1 3 1 

0 A a 
ll er Ud e | al e a 
lo alla 3 2 1 3 


Por lo tanto, si los valores propios de una matriz son O y 1, no implica 
que la matriz sea simétrica e idempotente. 


Teorema 8.2 Si A es una matriz simétrica, idempotente y no singular, 


entonces A = I,,. 
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Demostración. 

Si A es idempotente, entonces AA = A. Multiplicando ambos lados 
por A7!, se tiene lo que se quería demostrar. Mm 
Teorema 8.3 Si A es idempotente, entonces [,, — A es idempotente. 
Demostración. 

Queda como ejercicio para el lector. M 
Teorema 8.4 Sea A una matriz simétrica e idempotente de tamaño nxn 
con rango r, entonces existe una matriz ortogonal Q de tamaño n xn y 


una matriz R* de tamaño n x n tal que 


A =QR' y A A 
O:0 | 
donde I, es la matriz identidad de tamaño r x r. 


Demostración. 
Por el Teorema 3.33, la matriz A se puede factorizar como sigue 


A=USV?, 


donde U y V son matrices ortogonales de tamaño nx n y S es una matriz 
diagonal de tamaño n x n con r elementos iguales a uno y los elementos 
restantes n — r de la diagonal iguales a cero. 

Puesto que A?= A, se tiene que 


USVUSV"=U83V*, 
de lo cual se obtiene que 
SyrUS =8 o Svu=lÍs 
Tomando R* = SV! y Q =U, se llega a 
A =QR* con KO = Is 
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Teorema 8.5 Toda matriz cuadrada real A de tamaño n xn que pueda 


expresarse en la forma: 

A=Q0, (8.1) 
donde Q es una matriz real de tamaño n x m (m < n) con columnas 
ortonormales en I¡R'", satisface lo siguiente: 

(1) A es simétrica e idempotente. 


(2) A(In — A) = (In — AJA=0. 


(3) (1, — 4)Q =0. 
Demostración. 
(1) Si A= QQ?, entonces 
A* =(QQ)' = (00 =QQ' =A 
A? = (QQ) (QQ*) = 0(0'0)0! = QImQ!' =0QQ' =4. 
(2) A(T, — A) = A— A? =0, e igual para el otro caso. 


(3) (hn — 4)Q =0Q-(QQ0=Q-QIn=0.w 


Ejemplo 8.2 Encuentre una factorización QR de la matriz: 


El 


1 
3 pal 2, =L 


-1 -1 2 


Solución. 
Denotemos las columnas de A por 
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Apliquemos el algoritmo de Gram-Schmidt al conjunto (21, 72,73), el 
cual es una base para el espacio generado por las columnas de A. Como 


ER —2 
1 
[71 || = 5V6, se hace % = 121 = Íó 1 | . Por otra parte, 
1 
O q 0 A 
Va = La — (La WU) =5 2 + 33 —1 E 1 
—1 —-1 —1 
0 
Entonces, | v3|| = 5v2 y U2 = wo 1 | . Por último, 
—1 
3 1] 2 0 0 
Y = 23 — (23 - 01)01 — (83 - Ua)U2 = E +6 1 +5 1|=]|0 
2 E) dl 0 


esto sucede porque U3 es una combinación lineal de 4% y Uz. Se puede 
verificar que Y, y Ya forman una base ortonormal para el espacio generado 
por las columnas de 4, ya que 1; - v3 = 0. Entonces, formamos la matriz 


Luego, la matriz R es 


rt ME 
e | 


A! 


Nótese que R = Q*, por lo tanto, la matriz A es idempotente. 


Definición 8.2 Matriz de Householder 


Una matriz de Householder viene dada por 
H(Y) =1,-— 24%, (8.2) 


donde YVER” y vt7=1. 
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Teorema 8.6 Las matrices de Householder son simétricas y ortogonales. 


Demostración. 
Veamos primero que H (5) es simétrica 


[4 (5)]*= [1, - 200*]' = 1, — 200 = H (0). 
Ahora, se mostrará que [H(0)]' H(5) =Lñ 


[4(0)]* H(0) = [£, — 200]? = 1, — 400 + 400t00 


= In — 400 + 400 = In, 


y se tiene lo que se quería demostrar. MM 


8.1.1 Factorización QR por reflexiones de Householder 


Una secuencia de transformaciones de Householder puede utilizarse para 
calcular la “factorización QR” de una matriz A = [a;¿] de tamaño m x n, 
ya que es posible escoger la matriz de Householder de manera que el vector 
elegido quede con una única componente no nula tras ser transformado 
(es decir, premultiplicando por la matriz de Householder). La manera de 
construir la matriz de Householder es la siguiente: 

Sean Y ER” y € el primer vector unitario de IR””, entonces se define 


u=- sllzcler, s = sgn(21) (8.3) 
H (0) = Im — 200 Y = EN 
dl ñl 


donde sgn(+) denota la función signo y 11 es el primer elemento de £. 
Nótese que Y es un vector unitario, luego H (7) es una matriz de House- 
holder y satisface que 


donde (4). y, Jenota la k-ésima columna de A y 


k (A), —s]lZlla1 
==7 con Ol. = 


1151] — (1 ] 


Este algoritmo se puede emplear para transformar gradualmente los vec- 
tores columna de la matriz A en una matriz triangular superior. En primer 
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lugar, se premultiplica A por la matriz de Householder Q1¡ = H (5), que 
se obtiene eligiendo y = ee Esto produce una matriz (2, A con ceros 
en la primera columna (excepto el primer elemento de la fila). 


QA =H(0) [(4), (4), --(4) »] 
=[s[|élléi (4) 828 ... (4), — Bni] 


s||z|| 712 «<.. Pla 
0 


LoLbe]] 


El procedimiento se puede repetir para 43 (la cual se forma eliminando 
la primera fila y columna de A, respectivamente), obteniéndose así una 
nueva matriz de Householder (25. Puesto que (25 es de tamaño menor 
que Q¡, para lograr que esta matriz opere con Q¡4 en lugar de A», se 
necesita aumentarla hacia arriba a la izquierda, colocando un uno en la 
diagonal, o en general 


[xi 0 | 
ay o 
Si se repite el proceso r veces, donde r = mínim — 1,n), entonces 
R =Qr:::Q2014, 


es una matriz triangular superior. Luego, tomando 


Q = Q1Q2--:Q», 


se llega a A = QR: la descomposición QR de la matriz A. 

Este método tiene una estabilidad numérica mayor que la del méto- 
do de Gram-Schmidt empleado anteriormente. Aunque cabe aclarar que 
encontrar la factorización (Q.R de una matriz de tamaño m x n mediante 
este método es extenso si se hace a mano. 


Ejemplo 8.3 Encontrar la descomposición QR de la matriz dada en el 


Ejemplo 8.2 mediante el uso de matrices de Householder. 


340 8. Matrices idempotentes y productos especiales 


Solución. 
Para encontrar la primera matriz de Householder, se emplea la pri- 


mera columna de la matriz A, es decir, (4) e z Mj=1=1".Duego, 


1 


> 1 o 1 
7=(4),=304 1) y lia =3v 


Usando la expresión (8.3), se tiene que 


entonces 
2 2-6 
Qi =H(0) =13 130) 5 [2-6 -1 -1] 


6248 Y8  y8 7] [2 1 1 


ll 
=l=g| VE 3+v8 34+V8 == |1 1-4 14% 
YE  3+v6 3+v6 1 144 1-% 


Ahora se calcula 


1 246 —v6 —vy6 
0 —3 3 


con lo que ya casi se tiene una matriz triangular. Solo se necesita hacer 
cero el elemento r32, tomando la submatriz principal bajo el elemento r:1 
y aplicando de nuevo el proceso a 
111 -—1 
As = Miu == ; 
edi 
Mediante el mismo método que antes, se obtiene la matriz de Household- 
er: 


Finalmente, se obtiene 
2 0 y2 2 -1 -1 


Q=>F|-1 -43 v2 R=-=ZG|0 -V3 Y3 
VO | Y ya á “lo 0 0 


La matriz Q = Q1Q» es ortogonal y R = Q%A es triangular superior, de 
forma que A = QR es la descomposición Q.R buscada. 
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Teorema 8.7 Si A es simétrica e idempotente y P es ortogonal, entonces 
PYAP es idempotente. 


Demostración. 
Si P es ortogonal, entonces 


(PLAPNPLAP) = PLA(PPEAP = PUAA)P =PLAP. 0 


Teorema 8.8 Sea A una matriz simétrica e idempotente de tamaño nxn 
con rango r, entonces existe una matriz ortogonal Q tal que Q'AQ = D,, 
donde D, es una matriz diagonal con r elementos iguales a uno y los 
elementos restantes n — r de la diagonal iguales a cero. 
Demostración. 

Este se sigue inmediatamente del Teorema 2.29. Mm 
Teorema 8.9 Si A es una matriz idempotente de tamaño nx n, entonces 
su forma de Jordan J = P-1AP satisface que Ta=J. 
Demostración. 

Queda como ejercicio para el lector. M 
Teorema 8.10 Si A = la¿¡] es una matriz simétrica e idempotente y si 
el 1-ésimo elemento de la diagonal es cero, entonces los elementos de la 
1-ésima fila y la ¿-ésima columna son todos idénticamente cero. 


Demostración. 
Puesto que A = 4?, se tiene que el ¿-ésimo elemento de la diagonal 


de A es 
n 
Qi = y QijQjio 
j=1 
Pero como A es simétrica Qij= Ají, 


n 
> 2 
Qi = 0; s 


j=1 
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Luego, si aj; = 0, entonces a¡¿ = 0 (para j = 1,2,...,n), es decir, los 
elementos de la ¿-ésima fila son todos cero. Y como A = A! se tiene que 
los elementos de la ¿-ésima columna son también todos cero. MM 


Teorema 8.11 £l producto de dos matrices simétricas e idempotentes es 


idempotente si el producto de las dos matrices es conmutativo. 


Demostración. 
Si AB = BA, entonces 


(ABJAB) = (ABBA) =A(BA)=A(AB)=AB. um 


Teorema 8.12 Sea A una matriz real de tamaño mx n (m > n) con 
p(A) = n, entonces la matriz C = A(AtA) a es simétrica e idempo- 
tente. 


Demostración. 
La matriz OC = A(AtA) A es simétrica, ya que 


ae 


0 =[a(ata) 4] =(4)[(4tay TA = ALA) Y 
Además, es idempotente, pues 
0? =[4(44) "47 [A(4A) 4] = AI (ACA) A! =C. 
Nótese que la matriz AA es no singular, pues A es de rango completo 
columna y p(A*A) = p(A). a 
Teorema 8.13 Sea A una matriz simétrica e idempotente de tamaño 


nxmn, entonces 


Demostración. 
Por el Teorema 8.8, existe una matriz ortogonal (Y tal que A = 
QD,Q*. Luego, se tiene que 


(4) =t+(0D,9) =t1[D,Q0) =tr(D,) =r =p(0): m 
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Teorema 8.14 Todas las matrices simétricas idempotentes de rango in- 


completo son semidefinidas positivas. 


Demostración. 
Queda como ejercicio para el lector. M 


Teorema 8.15 Sea A una matriz real de tamaño n x n, entonces Á es 


simétrica e idempotente si y solo si 


P(A) + PUn — A) =n. 
Demostración. 
Supongamos que 
P(A) + p(In — A) =n, 
y sea R(A) el espacio de los renglones de A. Veamos que 
R” =R(4) 9 R(L, — A). 
Obsérvese que 
n = dim(R”) = dim(R(4) O R(In — A)) 
dim(R(A4)) + dim[R (1, — A)) — dim[R(A) NR, — A)) 
= p(A) + pl(L, — A) — dim(R(A) NR(In — A)? 
= n— dim(R(4) NR(L, — 4)). 
Esto implica que dimfR(4) NR (I, — A)j =0, de lo cual se tiene que 
R(A) RU, — A) =0. 
Por consiguiente, R” = R(A) O R(I, — A), y esto exige que 
A(I, — A) =0. 


Supongamos que no es así, entonces existen vectores no nulos u y Y en 
R” tales que 


A(I, — AJú =0. 
Luego, Y € R(A), pero como A(T, —- A) = (La — AJA, se tiene que 
(da — A) Au =0. 


Esto implica que Y € R(I, — A) y se llega a una contradicción. Por lo 
tanto, A(L, —- A) = O o 4? = A. Esto completa la prueba. M 
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Ejemplo 8.4 Determine el rango de la matriz asociada a la forma cua- 


drática del Ejemplo 5.5. 


Solución. 
La matriz asociada a la forma cuadrática dada en el Ejemplo 5.5 era 


In — Jn. Veamos si es simétrica e idempotente. 


q y! Leer ! Li 
(mn—JIn) =(M--1']) =(/.--14 
n n 
a 1 1 
AA (s, - 1) (7, > 211) 
n n 
1 É 1 É 1 pS t 1 b $ 
= Ip 10 1411 LL= 1 11 = lp ) 


Luego, por el teorema anterior se tiene que 
pla = Jn) =n= plTa) =n-=—1, 


pues la matriz J,, tiene únicamente una fila linealmente independiente. 


Teorema 8.16 Sean Aj y Az dos matrices cuadradas del mismo tamaño 


y A= A¡ + As, entonces las siguientes condiciones son equivalentes: 
(1) A es simétrica e idempotente y p(A) = p(A1) + p(A2). 


(2) Aj y Az son simétricas e idempotentes y A¡ A = A341 =0. 


Demostración. 
Supongamos que (2) es verdadero, entonces 


A? = (41 + 42) (41 + 42) 
= Aj + A+ 4142 + A241 = Ar + 4o. 


Puesto que A, A1 y Ax son idempotentes, 


p(A) = tr(4) =tr(41 + 42) =tr(41) + tr(42) 
se p(A1) + p(A2). 
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Ahora, supongamos que (1) es verdadero, por el Teorema 8.15, 


n =p(A) + p(In — A) = p(A1) + p(42) + p(In — A) 
2 p(A1) + p[ A) + (La E A)] 0 p(A1) + Pla Ar) 
2 p[Ar + (e = A1)] + pla) = NM. 
Por consiguiente, p(A) +P(In —A;) = n y de nuevo por el Teorema 8.15, 
se tiene que A, es idempotente; de manera análoga, se puede mostrar que 
A» es idempotente. Ahora demostremos que 414 = 4241 = O. Dado 
que A, Aj y Az son idempotentes y A = A¡ + A, multiplicando ambos 
lados por A, se obtiene que 
A =A?= (41 + A2)(A1 + 42) 
= Aj + A+ 4142 + 4241 = (41 + 42) + 4142 + 4241 
= A+ A149+ 494. 


Esto implica que 
A¡49+ 4241 = O, es decir, A¡A2 =— AA. 
Por otra parte, el hecho de que p(A) = p(A1) + p(42) implica que 
R(A1) AR(A») = (0). 
Este hecho unido con 4142 = — 4241 da 4142=0. Mm 


Corolario 8.16.1 Sean A¡, A2 dos matrices de tamaño n x n tal que: 
Al + A2= Ín, 


entonces las condiciones dadas en el Teorema 8.16 se cumplen. 


Demostración. 
Queda como ejercicio para el lector. M 


Una generalización del Teorema 8.16 en el que se involucran más de 
dos matrices se presenta a continuación. 
Teorema 8.17 Teorema de Cochran 

Sean Aj, A2,..., Aj una colección de m matrices de tamaño nx n y 


m 
A= ) A;. Considere las siguientes condiciones: 
i=1 
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(1) Cada A; es simétrica, idempotente y conmuta con A. 
(2) A¡A; =0 para toda ¡4 j y p(A?) = p(A;) para toda i. 
(3) A es simétrica e idempotente. 
(4) 0) = E rlA). 
Entonces, cualquiera dos de las condiciones (1), (2) y (3) implican la va- 


lidez de la condición (4). Además, las condiciones (3) y (4) implican la 


validez del resto de las condiciones. 


Demostración. a 
Suponga que (1) y (2) son dadas. Como A = )7 A;, es claro que es 
¿=1 
idempotente. Puesto que A y A1,49,..., Am son todas idempotentes, 


Así, la condición (4) es verdadera. 
Suponga que (2) y (3) son dadas. El cómputo de 4? produce 


m 
a? => Af, para 1<i<m. 
i=1 


Nótese que 
AA; = A¡A = A? y A?A; = A¿A? = A 


como A es idempotente, se tiene que 4? = A$, lo cual implica que 4? (1, 
A;) = O. La condición p(A,) == p(A?) es equivalente a la siguiente afir- 
mación: 


dim(R(A;)) = dim(R(4?)). 


Puesto que R(47) C R(4;), se tiene que R(A;) = R(A47). Por consi- 
guiente, existe una matriz D no singular tal que A; = DA?. Por lo tanto, 
A? EA —- A) = O implica que As(Tn —- A) = O de lo cual se concluye que 
A; es idempotente. Así, la condición (1) es verdadera y se sigue la (4). 
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Supongamos que (3) y (4) son válidas. Para ¿ 4 j, sea B = A; + Aj 
y C= A-— B, por (4) 


2, p(A;) =p(4) = p(B+C) 


< p(B) + p(C) <D  p(A;). 


¿=1 
De esto, se tiene que p(A) = p(B) + p(C), por otra parte, 
n =p(la) = p(B +1, -— B) < p(B) + p(In — B) 

=p(B) + p(L, - A+0C)< p(B) + p(L, — A) + p(C) 

= p(A) + p(I,— A) =n. 
Por lo tanto, p(B) + PLL — B) = n y por el Teorema 8.15, B es idempo- 
tente. Así se tiene que A; + Aj es idempotente y p(B) = p(4,) + p(4;). 
Por el Teorema 8.16, 4,4; = O y A; y A; son idempotentes. Así, (2) y 
(3) se obtienen de una vez. 


Suponga que (1) y (2) se cumplen. Es obvio que (4) se sigue aprove- 
chando la conexión entre rango y traza para matrices idempotentes. Por 
lo tanto, se tiene que (4) es válido y (3) se sigue ahora de lo que se ha 
establecido anteriormente. Esto completa la prueba. Mm 


Corolario 8.17.1 Sean A,,49,..., Am una colección de matrices simé- 


tricas e idempotentes de tamaño n x n tal que 


a, =- In» 


¿=1 
entonces las condiciones dadas en el Teorema 8.17 se cumplen. En este 


caso, las condiciones (1) y (2) son equivalentes. 


Demostración. 
Queda como ejercicio para el lector. Mi 


Teorema 8.18 Sean A¡,Az,..., Am una colección de matrices simétri- 
cas e idempotentes de tamaño n x n. Una condición necesaria y sufi- 
ciente para que exista una matriz P ortogonal tal que P?A¡P, PEA9SP,..., 


P*AmP sean todas diagonales es que A¡A; = A¿A, para toda i y j. 
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Demostración. 
Queda como ejercicio para el lector. M 


Ejercicios 8.1 


1. Obtenga condiciones para los elementos de las matrices idempo- 
tentes de tamaño 2 x 2. ¿Se puede generalizar a cualquier dimen- 


sión? 
2. Muestre que si A es idempotente, entonces A* es idempotente. 


3. Sea X una matriz de tamaño m x n (m > n) y rango n. Demuestre 
que la matriz H = e es una matriz simétrica e idem- 


potente. Obtenga la inversa de f,y — H. 


4. Suponga que KA = O con K idempotente. Defina G = (A — KK)”. 


Pruebe que: 


(1) AG=I-K, (16) AGA=A y (ííó) AGK=0. 


8.2 Productos especiales 


En esta sección se presentan nuevos conceptos de operaciones entre ma- 
trices, y entre otros, algunos productos especiales entre matrices. 


Definición 8.3 Producto Kronecker 

Dadas A = la¡¡] y B = [by] matrices reales de tamaño mx n y 
px q, respectiviumente, el producto Kronecker entre ellas, operación que 
se denotará por A8 B, es una matriz C = [c¡¡] = [05 B),, de tamaño 


mp Xx nq, dada por 
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aji B aj B dim LB 

A89B= [a Bl; = las B Qij B Gin B | > (8.4) 
Ami B Amj B Amn B 


donde cada submatriz aj¿B es de tamaño p x q. Este producto tiene sen- 


tido tanto para matrices como para vectores. 


Ejemplo 8.5 Considere las matrices dadas en el Ejemplo 2.8, determine 


AGByB0OA. 
Solución. 
Primero, se realiza AQ B: 
1 bl 
1B 4B 1 
AO me E e 0 
4 
1 
Ahora, se realiza B % A: 
1 
1A 1A 
EAS Ó al - 1 


nótese que AYSBABOA A. 


Teorema 8.19 Propiedades del producto Kronecker 


Sean A, B y C. matrices cualesquiera y U y Y dos vectores 


Entonces: 


| 
Fi 
EA 
E | 
. 
AAA] 
Rp 
| 
pan 
A 
| 
| 
he 


4 
1 
4 


Ep 


1. aAGA=A80=A, para cualquier escalar o. 


Ropa 


1 4 4 

—14 4 -—56 

4 1 1 

—=56 1 -—14 

1 4 

4 El 

—-14 -—56 

=56 —14 
columna. 
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10. 


11. 


12. 


13. 


. (44) 9 (8B) =aB(A8 B), para cualesquiera escalares a, B. 

. AGBABRA 

. (A8B)8GC=A8 (B8C) 

. (A+B)9C=A8CH+B0C, si A y B son del mismo tamaño. 


: A89(B+C) =AGBH+A8SC, si B y C son del mismo tamaño. 


(49 B)'=4t8 B!. 


. p(48 B) = p(4)p(B). 


Ñ tr(A 59) B) = tr(A) tr(B), si A y B son cuadradas. 


Sean A, B, C y D matrices de tamaño mxh, pxk,hxnykxq, 


respectivamente, entonces: 
(489 B)(C 8 D) = (4C) 8 (BD). (8.5) 


1 


(4A9B) = ATl8B"!, si A y B son matrices cuadradas invertibles 


de tamaño mxm y nxn, respectivamente, y (48 B) es no singular. 


Si A y B son matrices simétricas de tamaño m x m y n Xx n, res- 


pectivamente, entonces AG B es simétrica. 


Si A y B son matrices de tamaño m x n y p X q, respectivamente, 
con descomposiciones en valores singulares UASAVA y UBSgVÉ, 


entonces: 


(Un 9 UB) (Sa 9 Sp) (VA 9 VE) 
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produce una descomposición en valores singulares de AQ B (después 
de un simple reordenamiento de los elementos de la diagonal de 


SA 89 Sp y los correspondientes vectores singulares). 


14. 5: A y B son matrices simétricas de tamaño nx n, entonces usando 
la descomposición espectral de cada matriz, el producto Kronecker 
se puede expresar como sigue: 

A 
A8BB= ] y Apu (UU, ¡9 0,05), 
1i=13=1 
donde A;, 4; € IR son los valores propios y u;, U¿ son los vectores 
, Pei propios y U;, U; 


propios normalizados de las matrices A y B, respectivamente. 


15. úú=ieT=408 1. 
Demostración. 
1. — 3. Quedan como ejercicio para el lector. 
4. Por la Definición 8.3, se tiene que 
A89B = laj¡Bl;,, 
luego, 
(49B)89C = [(a;¿B),, 9C =0:(B9C),,, 
por lo tanto, (48 B) SCOC=A8 (B8C). 


5. Sea E = A+ B = [e;5] . Por la Definición 8.3, se tiene que 


E8C 


[es¿C],¿ = [(aij + bi5)C] 


6. — 8. Quedan como ejercicio para el lector. 
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9. Usando (8.4), cuando m = n, se tiene que 


r(48 B) e = > etel tr(B = SD asi tr(B) 


$=l Q4=1 1=1 


0 tr(A) tr(B). 


10. Usando (8.4), cuando m = n, se tiene que 


h 


as B| ál [c1jD Da au] BD 
l=1 


AJi(C).; (BD) > M] (BD)| 


(48 B)(C8 D) = 
== 
= (A 


15 
C) e (BD). 
11. Usando la expresión (8.5), note que 


(AB 1(4*8B) == mm 


12. — 15. Quedan como ejercicio para el lector. Mm 


Teorema 8.20 Sea A una matriz de tamaño m x m, con valores pro- 
pios A1,A2,..., Am y B una matriz de tamaño n Xx n, con valores propios 
111,12,..., im, entonces el conjunto de mn valores propios de AG B es 
dado por Din; 10= Ll dom Mi = A 


Demostración. 
Por el Teorema 3.19, existen matrices no singulares P y Q tales que 


PAP = Ja Q BO =Jb, 


donde Ja y Jg son matrices triangulares superiores con los valores pro- 
pios de A y B como elementos de la diagonal, respectivamente. Los valores 
propios de A Y B son los mismos de 


(P8Q)*(48B)J(P8Q) =(P 807 )(48B)](P8Q) 
= (PAP) e (Q*BQ) = Ja 8 Jp. 


Esta matriz es triangular superior ya que Ja y JB son triangulares y, por 
lo tanto, los elementos diagonales de JA Y Jpg son sus valores propios, los 
cuales vienen dados por 


A AA 
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Corolario 8.20.1 Si A y B son matrices cuadradas de tamaño m x m 


y nxmn, respectivamente, entonces 


det[4 6 B] = [det(4)]" [det (B)]”. (8.6) 
Demostración. 
Por el Teorema 3.19, existen matrices no singulares P y Q tales que 
PAP = Ta QUBQ =Jb, 


entonces los valores propios de 48 B son los mismos de Ja 8% JB, luego 


det[Ja O Ja] = 1 10.) - Aria 4) 


j=1li=1 j=1 i=1 
n 
= II pa det(4) (det A)” II eN 
j=1 j=1 


(det 4)" (det B)”. 


Teorema 8.21 Si A y B son matrices semidefinidas positivas de tamaño 


mxmoynxmn, respectivamente, entonces AS B también lo es. 


Demostración. 
Queda como ejercicio para el lector. M 


Ahora, se considera el operador que transforma una matriz en un 
vector, el cual es conocido como el operador Vec. 


Definición 8.4 Operador Vec 
Sea A = [a¡¡] una matriz real de tamaño m x n, si (A).¡ denota la 
j-ésima columna de A, entonces vec(A) es el vector de tamaño mn x 1 


dado por 


con (Al = o : (8.7) 


Amj 
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Ejemplo 8.6 Considere las matrices dadas en el Ejemplo 2.8, determine 
vec(A) y vec(B). 


Solución. 
En este caso, vec(A) y vec(B) vienen dados por 


1 1 | 
vec(A) = | vec(B) = |; | 
il 14 


Teorema 8.22 Propiedades del operador Vec 
Sean A, B y C matrices cualesquiera y U y U dos vectores columna. 


Entonces: 


1. vec[(aA + BB) = a vec(A) + B vec(B), si A y B son matrices del 


mismo tamaño y para cualesquiera escalares a, 6. 


2. tr(44B) = [vec(A)]'vec(B), si A y B son matrices de tamaño 


mxmn. 


3. Si A, B y C son matrices de tamaño mx n, NXP Y PX q, respec- 


tivamente, entonces vec(ABC) = (C! 8 A) vec(B). 


5. vec(ú ú!) =U0QU. 
Demostración. 


Véase en Graybill (1983). mm 


Definición 8.5 Producto Hadamard 
Dadas A = la¡j] y B = [b;j], matrices reales de tamaño m x n, 


entonces el producto Hadamard entre ellas, operación que se denotará 
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por AO B, es una matriz C de tamaño m x n cuyo elemento genérico 


ci¡, viene dado por: 
AOB=C= [esg] = [cz 50r5]; e= LA mm = L 2 20 7 (88) 
Este producto tiene sentido tanto para matrices como para vectores. 


Ejemplo 8.7 Considere las matrices dadas en el Ejemplo 2.8, determine 


AOB. 


Solución. 
Empleando la expresión (8.8), se resuelve AO B 


aj1b11 a12b12 1 4 
AOB = = ] 
ba b21 422 $e h | 


Teorema 8.23 Propiedades del producto Hadamard 


Sean A, B y C matrices de tamaño m x n, entonces: 
1. AOB=BO0A. 

2. (AO0B)OC=A0 (BOC). 

3. AO0(B+C) =AOB+A0GC. 

4. (A+B)0C=A0C+BOC. 

5. (AO0B)'=A0 B!, 

6. P(AO B) < p(A)p(B). 


TS Sn E Y LE. entonces AD Tin = Tin DA = A. 


n> 
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10. 


11. 


12. 


. Sim=n y D es una matriz diagonal de tamaño n x n, entonces: 


a) (A0B)D=(AD)OB=A0(BD). de 
b) D(AO0B)=(DAJOB=A0(DB). 


. vec(A O) B) = (vec A) O) (vec B). 


art oí = (100) (101), donde 1,0 ER” y 5,7 € R”. 


Si A y B son matrices simétricas de tamaño n xn, entonces usando 
la descomposición espectral de cada matriz, el producto Hadamard 
se puede expresar como sigue: 
n n 
> > > > yt 
A0B=)_) Ain (us 0 0y) (1, 0 5;)", 
¿i=1j=1 
donde Ai, 1; E R son los valores propios y U;, YU son los vectores 


propios normalizados de las matrices A y B, respectivamente. 


Si A es una matriz simétrica de tamaño 2x2, el producto Hadamard 
k 
de A por ella misma k-veces, es decir AQGAO...O0A= (O A, es 


j=1 


E as (3 + cos 20) (sen 20) (8.10) 


ko l> 
q=1 (sen 20)* (3 — cos 20) 
donde e = A + A, PB = Ar — Az, 0 > A), con A; los valo- 


res propios de A y 0 el ángulo de rotación de la forma cuadrática 


representada por A. 


Demostración. 

Puesto que algunas de las propiedades que se presentan en este ma- 
terial aparecen demostradas en algunos textos de álgebra lineal, solo se 
demostrarán las propiedades (8.9) y (8.10). 
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1. — 7. Quedan como ejercicio para el lector. 


8. Se verifica solo la parte a). Para probar la otra parte, se procede de 
manera análoga. Por la Definición 8.5, se tiene que 


AOB=C = [cis] = [dorgy]», A a a O 


sea E = CD = [es;] , donde 


n 
en =Y cade 
k=1 
pero como D es una matriz diagonal, entonces di¿=0sik AX J, 
luego cixdxj = 0 cuando k H j. Por lo tanto, 
Cij = Cijdij, 
y al sustituir c;¿, se obtiene que 
eij =05jbi3dj; = (asjd;5)bij = ijbijo 


donde 
e = ada 
k=1 


luego, E = (AD) O B. Si se agrupan los términos de e¿j de otra 
manera, se tiene 
eij =05jbi3d;¿ = 015 (di3d;;) = 05594; 


donde 
gi =D _ dirdes, 
k=1 


y en este caso, E= AO(BD). 
9. — 11. Quedan como ejercicio para el lector. 


12. Supongamos que la matriz tiene la siguiente forma : 
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Entonces, el ángulo 0 de rotación satisface las expresiones dadas 
en (5.62). Luego, A se puede expresar como 
he A1 — Aa YE DS + cos 20 sen 20 
NES sen 20 y + z2 — cos 20 
2 
Por lo tanto, el producto Hadamard de A por ella misma k-veces 
sería 
O A pa a — EA 4 cos 20) (sen 20) 
k 
¿=1 E (sen 20) (3 sE zz — cos 29) 
nl 


Teorema 8.24 Si A y B son matrices semidefinidas positivas de tamaño 


n xn, entonces AO B también lo es. 


Demostración. 


Véase en Ding € Engle (2001). mm 


Teorema 8.25 Sean A¡,4A2,..., Am una colección de m matrices no sin- 


gulares de tamaño 2x 2 y A = y o Aj, con a; € R. Si det(A) H 0, 


2 =1 
entonces 
To des(A;) 
E j 1 -1 
A Aaa Ar 
¿i=1 
Demostración. 


Al emplear el Teorema 3.13, se tiene que 


A? —tr(A) A+ det(A)/ =0, (8.11) 


y como Á = y a A;, entonces 


1=1 


= 3 Qí tr(A, 


i=1 
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Al sustituir en ¡e se llega a 


y 0 A; [Ec a tr(A 


¿i=1 4=1 


Laa, 


4=1 


+ det(A4)I = O, 


esta expresión se puede reescribir como sigue: 


y A+ > y 00 A¡Aj — y o tr(4,) A 


¿=1 a ¿=1 
=- Y > esta tr(45) 4; + det(4)/ =0, 
i=1 ¿Hi 


y agrupando términos, se obtiene 
Ya ¿[47 —tr(4;)A;] + > > 0505 A — tr(4;)1] + det(4) =0, 
¿=1 i=1 jAi 
pero como cada una de las matrices A; satisface (8.11), se tiene que 

m 
Na; [- det(4;)1] + Y $ oa A¡A7*[- det (Aj) 1] + det(4)] = 0. 
¿=1 i=1 jHi 


Aquí, se usó el hecho de que cada A; es no singular, y reagrupando, se 
llega a 


det(A)I = Y Es 00; det(A JA Aj? 


E AD da 
i= j=1 
AS uds 
j=1 


como por hipótesis det(A) 4 0, entonces A es invertible y, por lo tanto, 
det(4)47! =)Y ay det (Aj) A5* 
j=1 


Al dividir esta última expresión por det(4), se completa la prueba. Ml 


360 8. Matrices idempotentes y productos especiales 


Ejercicios 8.2 


1. Encuentre el rango de A B, donde 


2 6 5324 


A=H|1 4 y B=|2 1 1 


ba Loa 


2. Sean A y B matrices de tamaño 2 x 2, dadas por: 


2 6 1 2 
1.4 4 3 
Determine: 
a. AQ B, b.B8A, 
C. tr(49B), d. det(49 B), 
e. (A (5) By”, f. Los valores propios de A 6% B. 


3. Con las matrices del problema anterior, determine lo mismo pero 


para el producto Hadamard. 
4. Sean A, B y C matrices de tamaño m x n. Demuestre que 
tr[(41 o B90] =tr[4'(B0 0)]. 
5. Sean A y B matrices simétricas semidefinidas positivas de tamaño 
m x m. Demuestre que 


a. det (A O) B) > det (4) det(B), 


b. det (A O) Ari) > 1, si A es definida positiva. 
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6. Sean A y B matrices de tamaño m x m y n Xx n, respectivamente, 


demuestre que: 


[48 Bll2 = [14/21 Bl2. 


7. Sean A y B matrices de tamaño n x n. Demuestre que para todo 


keZ: 


(1894) =1,84 y (Bol, =B*8L,. 


Capítulo 9 


Inversa generalizada 
de matrices 


El concepto de inversa generalizada tiene sus principios en la teoría de 
ecuaciones lineales simultáneas (sistemas de m ecuaciones lineales con n 
incógnitas). La solución de un conjunto de ecuaciones lineales consistente 


Añ=b, (9.1) 


donde A es de tamaño mx n con rango r < mínfm, nj, puede asumir dos 
formas diferentes. Si m = n = r, el sistema (9.1) tiene solución única Y = 
Alb. Sin embargo, cuando Á es una matriz rectangular o singular, una 
representación simple de una solución en términos de A es más difícil. En 
este capítulo se tratarán estos sistemas de ecuaciones usando las inversas 
generalizadas de matrices. Dichas matrices las estudiaremos como una 
aplicación de las descomposiciones de matrices. 


9.1 Definición y propiedades básicas 


En esta sección, se analizarán las inversas generalizadas de matrices rec- 
tangulares o singulares. Estas inversas las estudiaremos como una apli- 
cación de los valores propios, considerando los dos casos: valores propios 
reales o complejos. 
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Definición 9.1 Inversa generalizada (79) 
Para cualquier matriz A cuadrada o rectangular, se dice que G es una 


inversa generalizada de A, si satisface las siguientes condiciones: 


(1) AGA= A, (i11) AG es simétrica e idempotente, (9.2) 


(14) GAG=G, (iv) GA es simétrica e idempotente. 


Nota 9.1 La inversa generalizada de A se llama también seudoinversa 


de A. 


Teorema 9.1 Si A es una matriz no singular, entonces G = A7!, 


Demostración. 
Queda como ejercicio para el lector. M 


Notación. 
La notación y nomenclatura que se usará en este capítulo para los 
cuatro tipos de inversa generalizada introducido en (9.2), es el siguiente: 


o Nombre Abreviación | Notación 
que satisface 

(1) TG condicionada gi-inversa AñO A* 

(3) y (11) TG reflexiva go-inversa ARO A" 

(3), (4) y (144) TG normalizada 93-Inversa AB O A” 

(1), (12) y (60) TG normalizada g3-inversa A 9 A” 

(6), (12), (121) y (60) La 7G g-inversa ADO AT 


Como veremos, el término “normalizada” significa de norma mínima. 


En la Definición 9.1, no se establece que toda matriz tenga inversa 
generalizada y que además esta sea única. Por supuesto que así es, como 
lo establece el siguiente teorema. 


Teorema 9.2 Sea A una matriz cuadrada o rectangular, entonces: 


(1) Siempre existe G. (2) G es única. 
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Demostración. 


(1) Si A es la matriz nula de tamaño m x n, es claro que la g-inversa 


de A es la matriz nula de tamaño n x m. 


Si se supone que p(A) = r > 0, entonces por la propiedad (¿v) del 
rango de una matriz (ver Capítulo 1), se tiene que existen K y L 
de tamaño m x r y r xn, respectivamente, y ambas con rango r 
tales que 


A=KL. 
Entonces, la matriz dada por 
A%0= LLE (KtK)"K* (9.3) 
es una g-inversa de A, y al sustituir en (9.2), se obtiene que 
(1) AAA = KLEMLEE) (KK) *KKL=KL=A. 
(ii) ALA49 = ELLE) (EEK) Ki = A), 
(ii) 449 = KLE:LES (KK) K=K(K'K) kt, 
(iv) A9A= ELLO (KK) KUKL=L:LLS) 7" L. 


1 


Nótese que las matrices AA9 y AJA son simétricas e idempotentes. 
Así pues, siempre existe una g-inversa de cualquier matriz A. 


Para probar la unicidad se procede por contradicción. Para ello, se 
supone que existen dos matrices A9 y B9 de tamaño n x m, ambas 
inversas generalizadas de A. 


Por ser 4% una g-inversa de A, se tiene que 
AAA =A. (9.4) 
Al multiplicar por B2, se obtiene 
AAAB? = AB?, 
y dada la simetría de AB9 y A42, resulta 
AB? = (AB9) = [(449) (4B9)]' = (ABIA) AL =AA?. (9.5) 
De manera análoga, premultiplicando a (9.4) por B? se llega a 


B9A =(B9A)' = [(B%4)(494)]' = AY(ABIA) = APA. (9.6) 
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Por último, si se premultiplica en (9.5) por B2, se tiene 
BY%AB? = BIAA?, 
y de acuerdo con (9.6) y la Definición 9.1, resulta 
B2 = BIAB? = (BA) A? = ALAAS = A9. 
Es decir, la g-inversa de una matriz es única. MM 


Ejemplo 9.1 


Dada la matriz A = , determine qué tipo de inversa gene- 


ralizada es G = 3 1 2 


[o o] 
Solución. 


Veamos las condiciones que cumple G de las dadas en (9.2): 


5! 
(2 A 8 1130 
AG=3 |; 2 A : E =3b al Said 


Nótese que AG = [, la cual es simétrica e idempotente, luego, 


2 As 
aGa= |; E 4 


Por lo tanto, la matriz G es A%. Veamos si cumple la segunda condición: 


2 1 30 3 


1 2 -1 1 
GA=3 [1 2 h E 3 j0 33. (9.8) 
0.0 00.0 
luego, GA no es simétrica, pero sí es idempotente. Por otra parte 
1 6 -3 
GAG = 9 3 6|=G. 
0 0 


Así, G es una matriz A9% y de la expresión (9.7), se tiene finalmente que 
G es una A%. No alcanza ser 49, ya que no cumple la cuarta condición. 
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9.2 Propiedades de las inversas generalizadas 


Algunas de las propiedades más importantes de la inversa generalizada 
se resumen en el siguiente teorema. 


Teorema 9.3 Sea A una matriz de tamaño m x n con rango r < 


mínfm,n) y A9 una matriz de tamaño n x m. Entonces: 
a) (499 =A. 
b) (AD)? = (49). 
c) (AB)? = BA?. 
d) A=AA(49) =(49)''ALA. 
e) 49= (AAA! = A (ALBO. 


F) (0.4)? = 09 A9, donde a. 4 0 es cualquier escalar con 0% =07!, 


g) Las matrices I,yn — AA? e I, — AJA son idempotentes con rangos 


iguales a m—r y n—r, respectivamente. 


h) p(A4%) = p(A). 


Demostración. 
En esta demostración, se utilizan las condiciones dadas en (9.2). 


a) Se tiene inmediatamente de las condiciones. 


b) Supongamos que la g-inversa de A? es (4*)2. Si se transpone la 
primera condición de la g-inversa de la matriz A, se tiene 


[AASA]! =A! 
AU(A9A =A!, 


Según el Teorema 9.2, la g-inversa es única, luego (4*)9 = (49). 
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c) - f) Quedan como ejercicio para el lector. 


9) Para verificar si las matrices son idempotentes, se eleva cada una 
de ellas al cuadrado: 


(Li — ALL)” = IL, — AA? — AAS + (AAAJAS = IL, — AAS, 
(T, — ASA)? =1, — ATA— AA+ AAA) =1,, — ASA. 


Como por el Teorema 8.13 el rango de una matriz simétrica e idem- 
potente es igual a su traza, se tiene que 


PlIm — AA) = tr(Lm — AA?) = m —tr(A4?) 
=m-— p(AA?%) =m-—r, 
p(Ln — ALA) = tr(I, — ALA) = n — tr(424) 


n— p(A24) =n—r. 


Aquí se uso el hecho que el rango de un producto no puede exceder 
el rango más pequeño de los factores, es decir 

(AA) < p(A) =r, 

(494) < p(A) 


! 
A 


1 
Pp 
Por el teorema del emparedado, se tienen las igualdades. 
h) Por la parte a), si AAYA = A, entonces 
p(A) = p(A4%A) < p(AA2) < p(A%). 
Por otra parte, la condición A9449 = A% implica que 


p(A9) = p(ATAA?) < P(AA9) < p(A). 


Así, p(A9) = p(4). Mm 


Teorema 9.4 Si A es una matriz simétrica, entonces A9 es simétrica. 


Demostración. 
La prueba se sigue de la parte b) del Teorema 9.3, es decir, 


A9 = (41) = (49). 0 
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Corolario 9.4.1 Si A es simétrica e idempotente, entonces: 


A? =A. 


Demostración. 
Queda como ejercicio para el lector. M 


Ejemplo 9.2 Determine la inversa generalizada de la matriz asociada a 


la forma cuadrática del Ejemplo 5.5. 


Solución. 
En el Ejemplo 8.4, se mostró que ly — J, era simétrica e idempotente. 
Luego, por el Corolario 9.4.1, se tiene que 


a Ta) =Ln Tes 


Teorema 9.5 Si A y A% son simétricas, entonces A9% = A?, 


Demostración. 
Puesto que 49% es simétrica, 


(494) = 44% = (44%)' = ABA, 


y la cuarta condición dada en (9.2) se satisface. M 


9.3 Métodos para calcular inversas generalizadas 


En esta sección, se ilustran algunos de los métodos para hallar la g- 
inversa. Se desarrollan solo los métodos que utilizan las distintas factori- 
zaciones de la matriz A estudiadas en este material. 

Aunque en esta sección se consideran únicamente matrices reales, 
cuando el lector necesite emplear alguno de los métodos desarrollados 
aquí para matrices complejas, simplemente puede realizar los cambios 
adecuados en cada método. Por ejemplo, en vez de utilizar A? se usa 4% 
y si en el método se emplea una matriz ortogonal, pues se cambia por 
una matriz unitaria. 
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Teorema 9.6 Sea A una matriz real de tamaño m x n con rango r < 
mínfm,n) particionada como: 


Ar: ; Aza 
A lus a cos la 


pe E Ae 


donde A¡1 Ó A» es una submatriz de tamaño r x r. Entonces: 


1. Si Aj es no singular y (4/41) = O, una g2-inversa de A es la 


matriz AR de tamaño n x m dada por 


An | 


AS = (9.9) 


On: xr : Ds e 


con m1 =mMm=—Yr yn =nNn —. 


2. Si A2 es no singular y (4/A22) = O, una go-inversa de A es la 


matriz AR de tamaño n x m dada por 


Oña x mi : O xr 


O E E (9.10) 
On E A) 


Demostración. 

Como la partición de las matrices expuestas son consistentes para 
el producto, efectúe los productos AARA y AR AA92. Obsérvese que se 
obtiene respectivamente A y AZ. m 


Ejemplo 9.3 


-1 
Dada la matriz A = , obtenga una go9-inVersa. 
1-23 
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Solución. 
La partición de tamaño 1 x (2 + 1) de la matriz dada es 


Ea 
A= : = (Arz : A12). 
12:3 


Al calcular la inversa de A11, se obtiene 


= 112 1 
Aj = 3 E A o 


Luego, una go-inversa es la matriz 


1 2 1 
A9 = 3 1 2 
0.0 


Nótese que esta es igual a la dada en el Ejemplo 9.1. 


Corolario 9.6.1 Sea A una matriz “diagonal” de tamaño mx n y rango 


r < mínfím,nj particionada como sigue: 


Drxr : Or xn di... 0 
A = sie . 2 > donde  Drxr = 


Om xr : Om Xx a] 0 EAN ” 


con mi; =m-—r yn, =n-—r. Entonces, la inversa generalizada de A 


está dada por 


(9.11) 


Demostración. 
Queda como ejercicio para el lector. M 
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Teorema 9.7 Sea A una matriz de tamaño n xn y rango m (m< n) 
con valores propios no nulos A1,A2,...,Am- 91 A se puede factorizar como 


n (2.33), entonces la A% viene dada por 


m 


Am = Y EA), (9.12) 


¡=1 0% 
donde E(A;) está dada en (2.11). 


Demostración. 
Puesto que A se puede factorizar como en (2.33), veamos si G = 42 
cumple la primera condición de la Definición 9.1: 


acá a (Y ¿220 00) 4 Ay 


i=1 ¿10 
m 
=A Y E(Ax) = 
¿=1 
Luego, G es una matriz A%. Veamos si es A9. 


GAG = (En E 19) 4 E ze 


Á=1 


- (Eno) [Ex 


Aquí se emplearon las propiedades dadas para las matrices E(Az) en el 
Teorema 2.12. Ahora, probemos si G es una matriz A9: 


m m 
1 
AG =A —E(A = (AE( Ax) E(Az) 
(E 200) - $ 3.4809) - Dz00 
Nótese que la última matriz no es simétrica, pero sí es idempotente. De 


manera análoga, se obtiene que GA es una matriz idempotente pero no 
es simétrica, luego G es una ga-inversa de 4. M 


Ejemplo 9.4 76 usando la descomposición de Sylvester 


4 1 2 


Sea A= |3 1 3|, obtenga una g2- inversa. 


115 
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Solución. 
En este caso, los valores propios de A son A1 =7,A2 =3 y Az =0, y los 
1 7 1 
vectores propios correspondientes son 41 = |1|,%,= |3| y U3= |-6|, 
1 -5 1 
respectivamente. Por otra parte, los vectores propios correspondientes de 
9 1 2 
A' son 1 = | 4|,W2= | 0| y W3= |-3|, respectivamente. Luego, las 
15 -1 1 


matrices de proyección espectral E(As) son 


sto y JA y [9 4 15 
E(M)= 55 = 98 1| [9 4 15] => [9 4 15 
aL 1 9 4 15 
a 7 TO 
>t 
Va, 1 1 
EM) = == 3 ta Al== 13.03 
0) Wo 12 l=3 
5 50 5 
a 1 E | 
5 1 1 
Eu) ==> 6 2 3 1]=> [12 18 4 
O 1 2 3: 
Al sustituir en (9.12), se llega a 
, [106 9 -52 
G=—|57 9 3|, 
al 
de manera que 
y [4 1 2] [106 9 -52 y 19 3 -1 
AG => (3 1 3||57 9 3|=>|12 3 6], 
1 1 5| |-41 9 95 2 20 
, [106 9 -52] [4 1 2 E! 
GA =7|57 9 3||3 1 3|=>|12 3 6 
-41 9 95||1 1 5 2 3-20 
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Entonces AG = GA, pero los productos no dan como resultado ma- 
trices simétricas aunque son idempotentes. Por otra parte, 


19 3 A] [412] , fs 21 42 
AGA=>3- [12 3 6|[3 1 3[=>[63 21 63|=4 
233929011115 91 21 105 
y 
19 3 -17 [106 9 -52 3 [742 63 -364 
GAG=— li2 3 6l|57 9 3|=-|30 63 -21 
9261 2 3 20 lua 9 os] %0llo37 63 665 


Al simplificar, se obtiene la matriz G, la cual satisface las condiciones (1) 
y (13) dadas en (9.2), pero no (11) y (iv), pues AG y GA no son matrices 
simétricas aunque son idempotentes. 


Teorema 9.8 Sea A una matriz simétrica de tamaño n xn y rango r, 


(r<n). Entonces, la inversa generalizada de A está dada por 
G=PNMP”, (9.13) 


donde P es una matriz real de tamaño n x n cuyas columnas son los 


vectores propios asociados a A, particionada como: 
PS ST = (4 0 Betti .. Dal (9.14) 


Aquí, la submatriz S es de tamaño n x r, sus columnas corresponden a 
los vectores propios asociados a los valores propios distintos de cero de 
la matriz A y la submatriz T es de tamaño n x (n— r), cuyas columnas 


corresponden a los vectores propios asociados a los valores propios nulos 


de A. 


pa 0* 
N9 = (9.15) 


o” O 
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con D la submatriz real de tamaño r x r que tiene en la diagonal los 
valores propios distintos de cero asociados a A, y con O la submatriz real 


de tamaño (n— r) x (n— r) en cuya diagonal están los valores propios 


nulos de A. 
Demostración. 

Puesto que A tiene n vectores propios 11, U2,...,U, que corresponden 
a los valores propios (no necesariamente diferentes) A1,A2,..., An, dichos 


vectores resultan ser linealmente independientes, y por lo tanto, la matriz 
P dada en (9.14) es no singular. 
Por consiguiente, la matriz A se puede expresar como A = PAP7!, 


donde Á = E al . 


Veamos si G = PA9P7*! cumple la primera condición de la Definición 9.1: 


AGA =A(PNMPAJA=(PAP(PNPNPADP=) 
= PAAPAPR= =PAP==A. 


Luego, G es una matriz 4%. Observemos si es 492: 


GAG =(PABPUA(PASPAS)= (PIP (PRES (PAP 
= PIVAMRIP== PEP=G. 


Ahora, verifiquemos si G es una matriz A9: 
AG =A(PEPA | = (PAPA (PREPA) =PIAAS [PA (9.:16] 
Pero como A = A*, por el Teorema 2.29, la matriz A es semejante a una 


matriz Q ortogonal. Si se ortonormalizan las columnas de la matriz P, se 
tiene que P7! = P* y, por lo tanto, 


(AGP =|P(AAD PT = (2 E o Py =P E O! P* = AG. 


También, G es 49%. Observemos si cumple la cuarta condición dada 
en (9.2) 


GA =(PAPDA=(PAIPA) (PAP =P(ALMPT. (9.17) 
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Usando de nuevo el hecho de que A es diagonalizable ortogonalmente, se 
tiene 


t 
(GA*=[PLEAPAE= (2 le al P) =P S al P*=GA. 
Así, G es la g-inversa de A y el teorema queda demostrado. MM 


Ejemplo 9.5 Inversa generalizada de una matriz simétrica 


5 4 ¡ 
Seda A=|4 5 39 


9 9 A 


En este caso, la ecuación característica es: 


, obtenga la g-inversa. 


Solución. 


det(A= AT) ==A* + 284? — 274 = 0. 


Entonces, los valores propios de A son A = 1, A2 = 27 y Az =0. 


1 
Para A = 1, se tiene el vector propio correspondiente vi = | 1 
0 
1 
Si Aa = 27, se obtiene el vector propio asociado va = |-1 
2 
1 
y para Az = 0, se llega al vector propio Y3 = | 1 
Estableciendo 
1.1 41 1 33 0 
P=|1 1 1 con Ppt=-=-|1 1 2 
0 2 1 A 2 2 2 
1.000 1 27 00 
A =|0 27 0 con A ==|0 1 0l, 
0.0.0 sl 0.0.0 
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se obtiene 


1 1 1 -1| [27 0 0] [|-3 3 0 
G= 7162 E 1 0 1 0-1 1 -2 
0.2 1 0.0.0 2 2-2 


Después de realizar la multiplicación de las matrices, queda 


y 41 40 1 
6=7 (0 4 Al, 
1 1 2 


1 5 4 9 41 40 1 1 2 1 1 
AG ==>|4 5 9 40 41 -1| =2|1 SL: 

3 9 9. 18 1-1 2 1-1 2 

1 41 40 1 54 9 2 1 41 
GA => |40 41 -1| |4 5 9|=-|1 2 -1 

en 1-1 2 9 9. 18 1-1 2 


Así, AG = GA y, además, los productos dan como resultado matrices 
simétricas e idempotentes. Por otra parte, 


1 2 1 1 54 9 1 15 -12 27 
AGA = 3 11.2 -A1f|4 5 9|=27]|-12 15 -27| =4, 
1-1 2 9 9 18 27 -27 54 
1 2 1 1| [41 40 1 41 40 1 
GAG === |1 2 -1| [40 41 -1| === ]|40 41 -1| =G. 
27 1-1 2 1-1 2 ze 1-1 2 


Corolario 9.8.1 Sea A una matriz singular de tamaño n xn con valores 
propios (reales o complejos) distintos de cero A1,A2,..., Ar (r = p(A)). 


Entonces, una g2-inversa de A es la matriz definida de la siguiente forma: 


AR =PAIP, (9.18) 
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donde P! y A2 están definidas de manera análoga a (9.14) y (9.15), y 


He T si m.g-(A;) < m.a. (A) 


R si posee valores propios complejos, 


en donde J es la matriz de Jordan dada en (3.11) y la matriz R, 
en (2.23). En este caso, AG = GA. 


Demostración. 
En el Teorema 9.8, se demostró que G era A9%. Para demostrar que 


AG = GA, de (9.16) y (9.17), se tiene que 
AG =P(AA9)P” y GA =P(MAJP”. 


L, 


== 
Dado que AAY = ALA S O 


| , el corolario queda demostrado. Ml 


Ejemplo 9.6 76 de una matriz con valores propios reales 
Obtenga una ga-inversa mediante el método propuesto para la matriz 


dada en el Ejemplo 9.4. 


Solución. 
En el Ejemplo 9.4, se obtuvo que los valores propios de A eran Aj =7, 
1 
A2 =3 y Az =0, y los vectores propios correspondientes eran Y = |1|, 
1 
-7 1 
va= |-3| y U3 = |-6 |, respectivamente. Estableciendo 
5 1 
1-7 1 1 27 12 45 
P=|1 3 4 con pr! = 34 T7 0 7 
LA 8 -12 4 
y 
700 1 3.0.0 
A =>10 3 0 con AM =3 [0 7 01, 
0.0.0 0.0.0 


1 Cuando la multiplicidad algebraica de un A; sea mayor que su multiplicidad 


geométrica, algunas de las columnas de P serán vectores propios generalizados. 
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se obtiene 
1 1-7 11||3 0 0| [27 12 45 
= —— 3 S| 0 7 0| |-7 0 7 
EOS 1.5 1|/J0 0 0 8 -12 4 


Después de realizar el producto entre matrices, se llega a 


, [106 9 -52 
== ler o 3 
ARO 


Nótese que esta matriz coincide con la obtenida en el Ejemplo 9.4, luego 
la matriz G es una ga-inversa de 4. 


Corolario 9.8.2 Sea A una matriz real de tamaño mx n (n < m) y 


rango r, (r <n). Entonces, la g-inversa de A está dada por 
G=(A%AJIA!, (9.19) 


donde (AtA)9 = PAIP=L es la matriz definida en (9.13). Sir = n, 
entonces G =(AA)J*A? y GA= Il. 


Demostración. 

En el Teorema 9.8, se demostró que la g-inversa de matrices simétri- 
cas cumplen las condiciones establecidas en la Definición 9.1. Entonces, 
(AA)? las cumple. Veamos si la expresión dada en (9.19) verifica las 
condiciones dadas en (9.2): 


AG= A(AAJ9A!. 


Pero por la propiedad d) del Teorema 9.3, se tiene que A = (AP)94*A, 
luego, 


AGA =[(A5994 AJA LAJLAA = (APICACA)(ACA)I(AtA) 
= (ABIALA) =A. 


Por otra parte, 


GA=(ALAJIAA. 
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Entonces, 


GAG =(AtAJLAtA(ALAJIA! = (ACA)I(ACA)(ALA)9 At 
= (AFAJLAÍ=G. 


Ahora, observemos si AG y GA son simétricas e idempotentes: 


(AG) =[A(A'AJL AT” = A[(A CATA 
= A[(AtA)LA! = AG 


(GA) =[(444)24"A]' = [(4"AJ9(4"A)]' 
=(AFAJU(AFA) =GA; 


la última expresión se tiene debido a que (4f4)% es una g-inversa de 
(ALA). 1 
Corolario 9.8.3 Sea A una matriz real de tamaño mx n (m < n) y 


rango r, (r <m). Entonces, la g-inversa de A es 
G= AAA, (9.20) 


donde (AA?)9 = PASPTL es la matriz definida en (9.13). Sir = m, 
entonces G= AAA)! y AG= Ip. 
Demostración. 

Queda como ejercicio para el lector. M 


Ejemplo 9.7 Considérese la matriz dada en el Ejemplo 9.1, obtenga la 


g-inversa. 


Solución. 
Como p(A) = 2, el producto de 44* da como resultado 


e [4 13 ql, EU 8 
a E sa id (44) => 13 14): 
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Luego, la inversa generalizada es 


, [5 4 
A9= AAA)" =G [4 5 
1 1 


la cual es diferente a la 49% dada en el Ejemplo 9.1. 
En el caso de que no se establezca primero el rango de la matriz A, 
se puede realizar el producto de 4* A, el cual da como resultado 


5 4 9 
AA=|4 5 9 
9-9 18 


En el Ejemplo 9.5, se obtuvo que la g-inversa para esta matriz era 


y [41 40 1 
(AAI=S 0 41 A 
1-1 2 


Por lo tanto, la g-inversa de la matriz A es 


1 5 4 
A? —= 9 4 -5 > 
11 


la cual coincide con la obtenida anteriormente. 


Ejemplo 9.8 Determine una g-inversa para la matriz: 


il 
A=11 1 2 


el 


El producto de 4.4* da como resultado: 


Solución. 


14 


7 
B=AA'=|7 6 
FA 


De 
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En este caso, los valores propios de B son A¡ = 21, A2 =5 y Az =0, y los 


2 0 
vectores propios correspondientes son 4, = |1|,V23= |-1| y U3z = 
1 1 
respectivamente. Estableciendo 
2 0-1 1 2 1 1 
P=|1 41 1 con pa 03 3 
1. 1 1 2 2 2 
y 
21 0.0 1 5.000 
A=|0 50 con A? =3p5 [9 21 0], 
0.0.0 0.0. 0 
se obtiene 
1 2 0 A1||5 0 0 2 1 1 
AA 1 1 1|f0 21 0||0O 3 3 
1.1 1||0 O 0OJ||2 2 2 
Después de multiplicar las matrices, queda 
1 10 5 5 
UL = 5 34 -29 
5 29 34 
Por lo tanto, la g-inversa de la matriz A es 
5 -29 34 
A=— 10 5 5 
ds 18 E 


El lector puede verificar que esta matriz cumple las condiciones dadas 


en (9.2). 


Teorema 9.9 Supóngase que A = LU es una descomposición de la ma- 


triz A de tamaño m x n, de rango r < míním,n). Entonces, la inversa 


generalizada de A está dada por 


1574 


G=U (000) (ED) TL, 


-1 


1 
1 


y) 


(9.21) 
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donde U es una matriz de tamaño nx r de rango r, obtenida de eliminar 
las filas nulas de U, y la matriz L de tamaño m x r, también de rango 
r, es obtenida eliminando las columnas que multiplican a las respectivas 


filas nulas de la matriz U. 


Demostración. 

Queda como ejercicio para el lector. M 
Ejemplo 9.9 Considérese la transpuesta de la matriz dada en el Ejem- 
plo 9.1 y utilice el Teorema 9.9 para hallar la g-inversa. 


Solución. 
Al transponer la matriz del Ejemplo 9.1, la factorización LU es 


PA! 00 [2 1 
1 -2|=|-5 1 0| |0 -3| =LU. 
E a 3 1 1J|0 0 


Si se elimina la última fila de U y la última columna de L£, se obtiene 


2 1 1.0 
2 1 eS 
1 
=] 29 = 25 1 0 y 15. 
3 3 3-1 2 


Luego, 
y por lo tanto 


Por otra parte, 


Es 103 
== Z 2 e 
PE = |; La 
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de donde 


semy-174_1[4 4] [1 -2 5] _1f[4 2 2 
a 1 =5|, 0 1 A 6|4 5 A” 


Siguiendo el procedimiento dado en (9.21), se tiene que 


a= 3 2([4 2 2 _1[5 4 1 
360 4Aj[4 5 1] 9|4 5 1)” 
la cual coincide con la transpuesta obtenida en el Ejemplo 9.7. 


Ejemplo 9.10 Considérese la matriz dada en el Ejemplo 9.4, obtenga la 
factorización LU de A y utilice el Teorema 9.9 para hallar la g-inversa. 


Solución. 
La factorización LU de la matriz dada en el Ejemplo 9.4 es 


4 1 2 1 0 01 [4 1 2 
31 3|=|% 1 0||jo ¿ 3| =LU. 
is 33 1]|0 00 


Al eliminar la última fila de U y la última columna de L, se obtiene 


4 1 2 1.0 
31331 5743-20. 
115 33 42 
Luego, 
4 
50! 1 | ñ ñ 1 les ' 
UN 11.3 4| 3 > 
LN 9 3 16 |52 37 
y por lo tanto 
40 37 -52 
pp, 37  -52 1 
(UD = <= 11 | == 6 8 
608 9 5 -52 336 152 1 100 
Por otra parte, 
: 1.0 
3 1 
0 1 31]|1f 8 |12 80|” 
e: 
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de donde 


FEAT FE ES s80 -12| |1 
o 112 E 13| [0 


Ria 
ÉS 


3|_1][20 12 4 
31 28|3 1 9]' 


Siguiendo el procedimiento dado en (9.21), se tiene que 


a a 52 po 6 E g [12 a y 
a A E O 


Nótese que esta matriz no coincide con la obtenida en el Ejemplo 9.4, por 
otra parte 


1 4 1 2| |112 49 -77 1 10 6 2 

AG = 532 313 12 10 6|= 14 6.5 3 y 
1 1 5| [-40 11 113 2 3 13 
1 112 49 -77| [4 1 2 1 37 6 -1 
GA === |12 10 6 31 3=3|6 2 6 
as “40 11 113| [1 1 5 sd 1.6 37 


En este caso, AG y GA dan como resultado matrices simétricas e idem- 
potentes. Además, 


. [io 6 -2] fa 12 56 14 28 
AGA= (6 5 3| [3 1 3[=7|42 4 42[=4 y 
2335 11115 14 14 70 
Al o 112 la 77 , [112 49 -77 
GAG==— 2 de lea 
apaño z . pa en ñ 1181 2|40 11 113 


Así, la matriz G cumple todos los requisitos dados en (9.2). 


Teorema 9.10 Supóngase que A = QR es una descomposición de la 
matriz A de tamaño mxn, de rango r < mínim, ny, de modo que Q tiene 
columnas ortonormales y R es triangular superior de rango r. Entonces, 


la inversa generalizada de A está dada por 


E=sI(ERTO". (9.22) 
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Demostración. 
Queda como ejercicio para el lector. M 


Ejemplo 9.11 Considérese la matriz dada en el Ejemplo 9.1, obtenga la 


factorización QR de A y utilice el Teorema 9.10 para hallar la g-inversa. 


Solución. 
La factorización QR de la matriz dada en el Ejemplo 9.1 es 


h 1 a A Yi M 5v5 a 


1 2 3 
1-23 ¿15 -¿V5] | 0  ¿v5 -¿v5 
Luego, 
B 0 
npt- [V5 ¿vV5 $v5 de A IS iio 
0 ¿v5 -¿v5] | 5 E 5 |-39 18|” 


9 3 
¿V5 -5V5 


y por lo tanto 


ne. ES 3 
(305) = 5 las el 


Por otra parte, 


Va 0 18 39 

1 5 
o 30 Es] - 5 le 
0V5 0V5 E 

Empleando el procedimiento dado en (9.22), se tiene que 
ya 18 39 25 1/5 15 [9 A pp A 

Srl: “IL 25 ml IT 

9 3/05 5 1 1 1 1 


la cual coincide con la obtenida en el Ejemplo 9.7. 


Ejemplo 9.12 Inversa generalizada de una matriz cuadrada 
Obtenga la g-inversa, usando el procedimiento dado en (9.22) para la 


matriz: 
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Solución. 
La factorización QR de la matriz dada es 


Ll TA 213 -¿v6 3¿v2 v8.3 «03 


1 -1 2|=| 3v3 ¿v6 3v2 0 0 y6 
1.1 1 13 ¿v6 0 0 0.0 
Luego, 
V3 y/3 y3 vV3 0 0 9 3y2 0 
RR=| 0 0 y6l|l|IY3 0. 01=/|8Y42 6 0l, 
0 0 0 vV3 y6 0 0 0 0 
y por lo tanto 
1 [2 4/2 0 
(REY == 42 3 0 
0 0.0 
Por otra parte, 
1.0 0/2 42 0 2 -y2 0 
3 3 
R (RR E 1 0 0||-y2 3 0 E 2 y2 0 
1 Y 0||0 0.0 0 2/42 0 


( 
1 1 
112 -v2 0] [-3v3 5 3 
G=373 12 v2 0| | -¿v6 ¿v6 zv6 |=3|1 1 4], 
0 242 0] | 3v2 3 


de manera que 


y A 12] A 1 Gb 0 
AG=33|1 1 2[[1 41 4[=3|6 6 0l, 
Dd all 2 a 0 0 12 
y 1 4] [A 1 2 ¿[6 60 
A==|1 1 4||1 1 2|==|- 
id 12 ajos 


2. 2 4||1 1 1 0 0 12 
De este modo, AG = GA. Además, 


Le 0 0 12 1 12 12 12 


6 4 6 6 


1 6 6 0||-1 1 -2 1 -12 12 -24 
AGA==|6 6 0 1-1 2 ==|12 -12 24| =A y 
= 1 1 

0 

0| |6 6 

2 0 


1 
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Así, la matriz G cumple todos los requisitos dados en (9.2). 


Teorema 9.11 Sea A una matriz real de tamaño n x n con valores sin- 
gulares distintos de cero 01,09,...,0, (r = p(A)). Entonces, la inversa 


generalizada de A está dada por 
E =SVSD", (9.23) 


donde U y V son matrices ortogonales de tamaño nx n y 59 es la inversa 
generalizada de la matriz dada en (3.39). 


Demostración. 
Por el Teorema 3.32, la matriz A se puede expresar como A = USV?* 
y, por consiguiente, la g-inversa es 


G=V30" 
Veamos si G cumple la primera condición de la Definición 9.1: 
AGA = A(VSIU)A = (USVH(V SUD (USV?*) 
=US(ViV)SUUTU)SV? =USV*= A. 


Aquí, se utilizaron los hechos de que U y V son matrices ortogonales y 
de que 5% es una inversa generalizada de S. Luego, G es una matriz A%, 
Veamos si es 492: 
GAG = (VSIUDA(VSIU? = (VSIUM (USVI (VS?) 
= V(S9SSNU* = VSIU*=G. 


Ahora, observemos si G es una matriz A% 


AG = A(VS%U*) = (USVY(VSIU*) = U(SS9U*. (9.24) 
Como 
> 0 
(Qi es 
ser [5 0] 09.35 


la matriz AG es simétrica e idempotente, por lo tanto G también es 4%, 
Observemos si cumple la cuarta condición dada en (9.2), 


GA = (VS%UA = (VS) (USV*) = V(SI9)V?. (9.26) 
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Usando de nuevo el hecho dado en (9.25), se tiene 
(GA) =GA. 


Así, G es la g-inversa de A y el teorema queda demostrado. MM 


Ejemplo 9.13 Considérese la matriz dada en el Ejemplo 9.12, obtenga 
la g-inversa. 


Solución. 
En este caso, los valores singulares de A son 0? = 12, 03 = 3 y 
0% = 0. Al calcular los respectivos vectores propios normalizados de 4% A, 


se obtiene 


Por otra parte, los respectivos vectores propios normalizados de la matriz 


AA? son 


hd 0 2 
A E A y A 
v2 | 0 1 2 10 


Por lo tanto, sí se establece que 


y 10. 1 ep, LS 
O ==—=||1l 0. 1 y V==|.42 y2 y2 
2104 0 61/15 3 0 
y 
vR 00 yv p00 
5=| 0. Yoll, luego 1 [02 01, 
0. 0.0 0.0.0 
se obtiene 
A 42 1-31 10 MM 1 0 
cl 
c- Y 1 yY2 v3||0o 2 ol lo O y2 
0.0 1 0 
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Después de realizar la multiplicación de las matrices, queda 


1 1.1 4 
A 1 -1 4 , 
2. 2 4 


la cual coincide con la obtenida en el Ejemplo 9.12. 


Corolario 9.11.1 Sea A una matriz real de tamaño m x n con valores 
singulares distintos de cero 01,09,...,0, (r = p(A)). Entonces, la g- 


inversa de A es la matriz definida de la siguiente forma: 
E=sVSTD", (9.27) 


donde U y V son matrices ortogonales de tamaño mx m y n xn, respec- 


tivamente y S% es la inversa generalizada de la matriz dada en (3.39). 


Demostración. 
Queda como ejercicio para el lector. M 


Ejemplo 9.14 Considérese la matriz dada en el Ejemplo 9.1, obtenga la 


gnvVersa. 
Solución. 


En este caso, los valores singulares de A son 0Í = 27 y 03 = 1. Al 
calcular los respectivos vectores propios normalizados de 4* A, se obtiene: 


1 -1 -1 


Por otra parte, los respectivos vectores propios normalizados de la matriz 


AA! son 


all all 
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Por lo tanto, si se establece 


1 -1 2 
1 - 1 
UNA y VGA, 
ya 62 ya 412 
y 
1 0 
1 
sy Ar luego S9 =——|0 3v3 
0 1.0 3v3 |0 0 


Así se obtiene 


1.01 1 


“7313 V6 ya | > 


1 
Sa 
OQ] 
S 
OO 
(99) 
Se 
(du) 
FA 
La 
he 
| A 


1 5 4 
G= 9 4 -5 > 
Ll 1 


la cual coincide con la obtenida en el Ejemplo 9.7. 


El primer método para determinar inversas generalizadas fue presen- 
tado en Penrose (1955a, 1955b) y está dado en el siguiente teorema. 


Teorema 9.12 Método de Penrose 
Sea A una matriz real de tamaño m x n y rango r < mínfm,n), 


particionada de la siguiente forma: 


Aj Az 
A= , (9.28) 
Az Az 
con A una submatriz no singular de tamaño r x r y (4/411) = O. 


Entonces, la inversa generalizada de A es 


APA, APA | 
al 14 A1P11493 (9.29) 


[A2PnAla Ajo Pir Ab] 


donde Pi = (41145, + A Alo) "Ar (44,411 + Ab, Ap1) 7. 
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Demostración. 
Como Aj: es no singular, la matriz A se puede particionar como sigue: 
An Ar| — |Az 
le Az] [421 Ll An Au]: 
a td _— 


ÁAmxn —= Lmxr Urxn 


En esta partición se usa el hecho que (4/41) = 0. Luego, 


AS _ il! 9 Az dl 
E LT, Ay A12] An 
Por el Corolario 9.8.3, se tiene que 


[1 Azi Ao] =[1 Aj Ay] ([L 434] [Artt] y 


Lay"! ñ + Ají 412442 (444) 


| 
| 4t2(4%,) (a r A Aj 7 (A) >) 


Nótese que 

= [471 (Ar1 + 412412 (A) 

= [An + Ap Ajo(A1) An 

= [(411441 + 412419) (441) ] An 
= A¡(A11 45; + A Aja) An, 


O O 


por lo tanto, 


Aj, (41141 + Ar2At2) "Ay 


I, AAjol? = mi 
iS 1 Ao (411411 + A124j9) "An 


Por otra parte, por el Corolario 9.8.2, se tiene que 


a 
ANA 
Ao1 Aa1| [421 A21 
si 
= [441 A11 ap Al Az1] [4% Abr) 
[(4j, An + At Ag1) At, (41, A E Ab, A21) * As] S 
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Si se realizan los respectivos productos, se llega a que la 49 es 


e A PuAjy AP 45 


Ñ (9.30 
Aa al Aj9Pri Aly lat 


| 


1 =-1 

con Pi = (41144, + A1241>) Az1 (44,411 + A5, 421) y el teorema 
queda demostrado. M 

Corolario 9.12.1 Sea A una matriz cualquiera de rango r, particionada 
como en 9.28, donde Az es una submatriz no singular de tamaño r x r 


y la submatriz (4/42) = O. Entonces, la inversa generalizada de A es 


A Poo A! Ar Pao Af, 
G= 21 12 21 22 (9.31) 
Año Po2 Ajo Año Po2 Ao 


donde Pao = (A22Añ, + Az Al,) * 420 (A5, A29 + AtyA13) 7. 


Demostración. 
Queda como ejercicio para el lector. M 


Antes de dar ejemplos, se proporciona el siguiente procedimiento que 
recoge el método de Penrose para determinar la inversa generalizada: 


Procedimiento para determinar la inversa generalizada 


Realice una partición de la matriz A como sigue: 


Ar A 
A= 
da As2|” 


de tal manera que una de las submatrices 411 o A22 sea cuadrada 
y tenga igual rango que la matriz A. 


I. Si 411 es la submatriz no singular: 
a) Verifique que (A/411) = 0. 
b) Obtenga: 
Pu = (411 4], + Ap Al,) *An(Al¡ An + Ab Ap1) 7. 
c) Forme la matriz: 
AyPIAr, AyPrrAbr 
AjoPiAjy AjoPiiAy1] ” 


este resultado es la inversa generalizada de A. 
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II. Si 49 es la submatriz no singular: 
a) Verifique que (4/422) = 0. 
b) Obtenga: 
Pao = (A22 Ah) + Ax A1) * Az (Año 99 + Alo Aro) >. 
c) Forme la matriz: 


Ad Per Ajo Ad Pardo 
Añ3P22 Aj) Añ3P22 439, 


este resultado es la inversa generalizada de A. 


Ejemplo 9.15 Calcule, utilizando el método descrito anteriormente, la 


inversa generalizada de la matriz dada en el Ejemplo 9.4. 


Solución. 
Para la partición (2 +1) x (2 + 1), de la matriz dada se tiene 


4 1 2 | 

a4= 13 17312 ha mel 
tds E E Az1 Aza 

1 Les 

Luego, A¡1 es no singular ya que su determinante es 1. El lector puede 


verificar que (4/41) = O. Además, 


) ¿fir 13] [4 6] [21 19 
Andy + Ario = (yy 10) Fl6 97 [19 19 


25 7) [1 1] [26 8 
AjrAn + Aya = | A E al 


Por lo tanto, P¡¡ se obtiene como 


p [2 19 fa 1] [6 8] *_ 1 [57 -152 
17 l19 19| [3 1]|8 3| 532 |-55 156|' 
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El lector puede realizar los otros productos y llegar a que 


112 49 -77 
G== 112 10 6 
See ap: 11: 18 


la cual coincide con la obtenida en el Ejemplo 9.10. 


Ejemplo 9.16 Considérese la matriz dada en el Ejemplo 9.12. Obtenga 
la g-inversa mediante el método descrito anteriormente. 


Solución. 
Realizando una partición (1 +2) x (1 +2) a la matriz dada, se tiene 


al e A 2 
a = de 
ix 2 A Asa|' 
E O 


Luego, A es no singular, ya que su determinante es —3. El lector puede 
verificar que (4/422) = O. También, 


5 1 1 -1 6 0 
E 


2 1 1 2 3 3 
am DE 


Por lo tanto, Ps2 se obtiene como 


a [8 90 2f33_1 [1 
=> 10 3 1 11|3 9| — 36|8 4|' 


El lector puede realizar los otros productos y llegar a que 


1 1. 1 4 
G = 12 -1 4 
2.2 4 


Nótese que esta matriz coincide con la obtenida en el Ejemplo 9.12. 
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9.4 Vectores y valores propios 


Si A es una matriz no singular, por el Teorema 2.10 se sabe que los 
valores propios de 47! son los recíprocos de los valores propios de A y 
los correspondientes vectores propios son los mismos. En esta sección se 
muestran las relaciones entre los valores y vectores propios de una matriz 
cuadrada y los asociados a la g-inversa. 

Teorema 9.13 Sea G la g-inversa de A y Á un valor propio distinto 
de cero de A con vector propio correspondiente v % 0. Entonces, una 
condición suficiente para que Gu= AT es que AG=GA. 


Demostración. 
Si AY = Av, entonces, premultiplicando por AG, se obtiene que 


AGA =AAGU 
<= 


A Y =AAGU 
Av = AG. 
Como A % 0, entonces 
v = AGuU si AG=GA 
= GAv = AGU. 


Es decir, Gy= ATl. 


Ejemplo 9.17 Determine los vectores y valores propios de la matriz go- 
inversa, obtenida en el Ejemplo 9.4. 


Solución. 
En el Ejemplo 9.4, se obtuvo que 


, [106 9 -52 
ús >| 57 a 3 
2 (45 9 08 


El polinomio característico de G es 


po(A) =—¿LA(TA—1)(8A—1), 
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luego, los valores propios de G son Ai = 0, A2 = - y Az = , y los 


1 1 -7 
vectores propios correspondientes son 4, = |-6|,v= |1| y U3= |-3|, 
1 1 5 


respectivamente. 


Teorema 9.14 Si A es simétrica, los valores propios no nulos de A y 
A%93 son recíprocos. 


Demostración. 
Si AY = AV, entonces, premultiplicando por 44%, da 
AARBAV = AAA 
id, 
A 7 =AMA4%)5 
A =A(4%)'A0. 


el 


Como A X 0, entonces 
(4%) =715, 


El resultado se sigue, puesto que una matriz y su transpuesta tienen los 
mismos valores propios. M 


Ejercicios 9.1 


1. En los siguientes problemas, determine la inversa generalizada con 


los métodos descritos en esta sección: 


1 a] 0 1 a] 0 0 3 
a) E b) , c) 
1 1] po 2] ] 
1 1 ñ 5 2 ¡ 3-1 4 1 | 
dl De e A E 
1 1 a 1.2 a 45 2 . 
2. Encuentre una inversa generalizada para cada una de las siguientes 


matrices: 
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(a) PAQ cuando P y Q son no singulares 
(b) GA cuando G es una inversa generalizada de A 
(c) kA cuando k es un escalar 


(d) PAP? cuando P es ortogonal y A es idempotente 


3. Sean A y X matrices simétricas tal que AX = 0, si X es idempo- 
tente y A+X es no singular, pruebe que (A E > es una inversa 


generalizada para A y X. 


1 
4. Para X particionada como X = con X1 de rango completo 
X 


columna, pruebe que X(X*X)9X*= X¡(X1X1)9X!. 


9.5 Solución de sistemas de ecuaciones lineales 


Entre las múltiples aplicaciones que tiene el concepto de inversa genera- 
lizada cabe señalar el papel que desempeña en el análisis y la “solución” 
de sistemas lineales consistentes e inconsistentes. En el caso de sistemas 
consistentes, como las soluciones existen, permite caracterizarlas, y para 
sistemas inconsistentes, a pesar de que por definición carece de soluciones, 
proporciona soluciones aproximadas. En esta sección se analiza con ayuda 
de la g-inversa de la matriz A cuando (9.1) es consistente y cómo son sus 
soluciones. 


Teorema 9.15 El sistema de ecuaciones lineales dado en (9.1) es con- 


sistente si y solo si se verifica que 


AA9b=b, (9.32) 
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Demostración. 
Si para A%, se cumple que 


AASMb=b, 


entonces el sistema (9.1) es consistente, puesto que al menos 2” = AS b 
es solución. 

Recíprocamente, la condición es necesaria pues si el sistema es con- 
sistente, existe Xy € R” tal que 


AZo =b. 


Ahora bien, como A9 siempre existe, premultiplicando la expresión an- 
terior por A491, se obtiene 


AARAZ) =AARb 
<= —- 


A Zo =AANb 
-— 


bb =AAMb, 


lo cual prueba el teorema. E 
Teorema 9.16 Dado un sistema consistente: 
AZ =b, 
con A de tamaño mx n, TER” y be R”, se verifica que: 
¿) Para todo d € R”, 
To = ARb4H (1, — ARA)d (9.33) 
es solución del sistema. 


11) Si Y es una solución cualquiera del sistema, existe de R” tal que 


Z'" puede expresarse en la forma dada en (9.33). 
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Demostración. 


¿) Sea o una solución del sistema, es decir 
Azo =b. 
Entonces, por el Teorema 9.15 y la definición de 49!, se tiene que 
AZ = AANB+ A(L, — ANA)Jd=b+ Ad— Ad. 
11) Si 7” es una solución cualquiera del sistema, se verifica que 
b- AZ =0, 
Si se premultiplica por 49 y se suma 7” a ambos lados, se tiene que 


ANH-AÑAR + E = 
ANb+ (L, — ARA)Z o 


Luego, tomando en el lado izquierdo d=Y , se obtiene lo que se 
deseaba. Ml 


Teorema 9.17 Dado el sistema consistente: 
AZ =b, 


con A de tamaño mxn, TER" ybEeR"”, se verifica que existe solución 
única X” si y solo si AYA = I,,, siendo A% la g-inversa de la matriz A. 


Demostración. 
Queda como ejercicio para el lector. M 


Ejemplo 9.18 Determine una solución del sistema de ecuaciones: 


xi+6x2+11lx3 =0 


6x1 + 46x2 + 8613 = 20 (9.34) 


l1x1 + 86x2 + 16123 = 40. 
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Solución. 
Si se reescribe (9.34), se llega a 


1.6 117 [x1 0 
6 46 86 | |x2| = |20|. (9.35) 
11 86 161| [23 40 


El sistema dado en (9.34) se puede resolver usando inversa generalizada 
y usando cualquiera de los métodos descritos en este capítulo. De esta 
manera, se tiene que 


1 517 190 -137 
AR = 180 190 70  -50 
137 50 37 


Veamos si el sistema de ecuaciones (9.34) es consistente determinado 


517 190 -137 1.6 11 


AYA =37 [190 70 -50| [6 46 86 
137 50 37 | [11 86 161 
y [5 2 1 
=2|2 2 2|%Z. 
1.2 5 


Por el Teorema 9.17, el sistema es consistente indeterminado, luego una 
solución de (9.34) es 


21 , [517 190 -137] fo 
z2| ==3g [190 70 -50| [20 
23 -137 -50 37 | [40 
517 190 -137] [o , [28 
=7 [190 70 -50| [1| =-3 [10|. (9.36) 
-137 50 37 | |2 3 


Teniendo en cuenta el Teorema 9.16, para todo d= (a, B,y) € RÍ, el 
vector 


Ñ 56 +a-— 28 + y 
Lo = AY + (I, — ALA)d = = |-20-2a0+48B-2|, 
16+0a-28+y7 


es una solución del sistema, como el lector puede comprobar fácilmente 
sustituyendo Zo en (9.34). 
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Teorema 9.18 Dado el sistema de ecuaciones lineales: 
AZ =b, 


en donde A es una matriz de tamaño mxmn con rango r, TER” y be R”., 


Considérese la función residuo: 


para cualquier Y. Entonces, 2” = A9b es una solución aprorimada mínimo 
cuadrática (LS por su sigla en inglés) del sistema si y solo si mínimiza a 


[Ir (2)11 


Demostración. 
Si se reescribe la norma euclídea de r(z), se obtiene que 


r(31?=r(2)'r(x) (470) (az) = (a! -D) (485) 
_—_—= 
F(a) =YAAR-D0AT— PAD DD, 
Para determinar la Y que minimiza esta suma de cuadrados de los resi- 
duos, se calculan las derivadas parciales? de F (%) con respecto a Y 
OF (2) 
OL 


=24* Af — 24'b=0. (9.37) 
Al despejar X, se obtiene un mínimo global de (5) pues 
2 (a) 
Ox? 
la cual es una matriz definida positiva si A es de rango completo, o se- 
midefinida positiva en caso contrario, y por ello, en ambas situaciones, 


F (5) es una función convexa. 
Luego, si se sustituye 2” en (9.37), se tiene 


=24A, 


AtAA%b— Alb =0 o (AAA — At)5 =0, 


2 Si el lector desea consultar técnicas de derivación matricial, puede ver Barbolla 
£z Sanz (1998, cap. 5). 
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pero como b es cualquier vector de IR””, esto equivale a la condición 
ATAAS = Af; 
esto se sigue inmediatamente del Teorema 9.3 parte d). M 
Definición 9.2 Dado el sistema lineal AZ = b y la función residuo 
r(z) = ÁZ — b, se dice que: 
1) Y es una solución aproximada mínimo cuadrática (LS por su sigla 


en inglés) del sistema si y solo si para todo 7 E R”, se verifica que 


11) Una solución aprorimada mínimo cuadrática 1” es de norma míni- 


— 


ma (MNLS por su sigla en inglés) si y solo si para todo Y E R”, 


se cumple que 


En el siguiente resultado, se recogen dos características de las soluciones 

mínimo cuadráticas LS para sistemas inconsistentes a partir de la g3- 

inversa de la matriz de coeficientes del sistema. 

Teorema 9.19 Dado el sistema de ecuaciones lineales inconsistente: 
Az =b, 

con A de tamaño mx n, YER” ybEelR”, se verifica que 


(1) r= Gb es una solución LS del sistema si y solo si G es una AS. 


(13) La solución Xy dada en (9.33) es una solución LS del sistema si y 


solo si 4! es solución del sistema consistente: 


AF = AA). 


404 
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Demostración. 


(1) Por el Teorema 9.18, una solución LS del sistema es de la forma 


= 


Z = Ab. 


Falta entonces comprobar qué condiciones de las dadas en (9.2) 
debe cumplir G si 2” = Gb es solución LS del sistema y, por tanto, 
solución de (9.37). Así, sustituyendo 2” en (9.37), se tiene 


A'AGb— Alb=0, 
y como bes cualquier vector de IR””, esto equivale a la condición 
PAG=A", 
que se verifica si y solo si G es una g3-inversa de A, ya que 
AG es simétrica y AAA. 
Si el sistema Ñ 
Al = AAPb 


es consistente, entonces por el Teorema 9.16, sus soluciones son de 
la forma 


E'= AR(AAS3b) + (1, — ALA)d 
para cualquier de R” o también 
7'= AP(AAMbh) + (1, — ABA)Jd= A%b4+ (1, — ARA)d, 


como cualquier g3-inversa de Á es a su vez 9¡-inversa. 


La demostración concluye si se muestra que 2” es una solución LS 
del sistema AZ = b. Para ello, razonando como en (4), 2” debe ser 
solución de (9.37), lo cual es válido pues de acuerdo con la definición 
de la g3-inversa, 


AYA[A%5 + (1, — A A)d] — AB = ACAA%b— Alb, 


y como AA% = (4%)%A?, dada la simetría de A4%, se obtiene 
finalmente que 


At(A9) "AD — AB=0. 0 
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Teorema 9.20 Dado el sistema inconsistente: 
AZ =b, 


con A de tamaño m xn, TER” y be R”, su solución MNLS es única 
y está dada por 
7 = Ab. (9.38) 


Demostración. 
Si A es la g-inversa de A, también es g3-inversa de A y, por ello, en 
virtud del teorema anterior, está garantizado que 


Z'= A% 


es solución LS del sistema. 
Bastará, por tanto, probar que 7” es única y de mínima norma. 


e 1 es MNLS. 


En efecto, por ser 2” LS, es solución del sistema 
AZ = AA% 

o equivalentemente 

AS AZ = ALAAIb = A9b. (9.39) 
Por lo tanto, cualquier solución LS es de la forma 

3 = A95+ (1, — ASA)Z, 
y el cuadrado de su norma euclídea es 

Ez = (A) A%5 + (2 ALAT) (2 ASAZ). 
Si se sustituye (9.39) en esta expresión, resulta 
Ez =B (AD) AID + (E AY) (E — ASb) 
= 14011? + ¡7 acólP, 


de donde 
£a> (8) (2) = 40]? 


cuando 2” = A9b. 
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e 2” es única. 


Supóngase que Zo € IR” es también solución MNLS del sistema. 
Entonces, Zy cumple que 


(7o)' (20) = 14%]? + llzo — Ave]? = (2) (2) = [14%]. 


Por lo tanto, 


[Zo — AS]? =0. 
Es decir, 
do — AD =0 > do = A. 
En consecuencia, 
du = Es 


y esto es lo que se quería demostrar. MM 


Ejercicios 9.2 


1. Encuentre una solución para cada uno de los sistemas de ecuaciones 


lineales dados a continuación: 


a) 321 — 219 —x3=1 b) 11 —%2-23=2 
11 + 2x9 +2x3 =2 211 +12+2x3 =4 
11 + 219 + 313 = 4. x1 — 4x9 — 513 = 2. 
c) 11 — 2x9 + 323 + 24 = 2 d) 11 — 2x9 + 23+ La = 2 
X1 —3+ 214=5 311 F2x3-2x14 = —8 
311 — 212 +23 e 4x9 — t3- t4=1 


921 F3r3z— ta = —3. 


9.5. Solución de sistemas de ecuaciones lineales 407 


. Sea X una matriz de tamaño mx n (m > n) y rango r < n. Sea G 


una inversa generalizada de X*X, defina: 


B=GX'Y, s? =(Y — XD) (Y — XD), 


bo =5- GQ(Q'GQ) (QU —m), con Q=(GXiXGX. 


Pruebe que: 


Capítulo 10 


Aplicaciones 


En este capítulo se recopilan algunos desarrollos teóricos de la estadística. 
El lector que esté interesado en profundizarlos puede consultar textos 
de modelos lineales o estadística multivariada (o cursar las asignaturas 
correspondientes). El propósito de este capítulo es ilustrar la utilidad de 
los conceptos tratados en este escrito, y por eso se omiten tanto conceptos 
básicos del área de la estadística, como aquellos temas avanzados que el 
lector aprenderá posteriormente. 


10.1 Matrices estocásticas 


Las matrices estocásticas corresponden a un tipo especial de matrices 
definidas positivas, y se usan con frecuencia en el estudio de fenómenos 
aleatorios, en teoría de la probabilidad y estadística. 


Definición 10.1 Una matriz A = la;¿] de tamaño n x n se dice que 
es estocástica por filas (columnas) si todos sus elementos son números 
reales no negativos y la suma de los elementos de cada una de sus filas 


(columnas) es igual a 1. Es decir: 
Ea El MO 
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y además: 
n 
Al = y ai =1 si A es estocástica por filas 
j=1 
n 
1YA= 3 ai =1 si A es estocástica por columnas, 
¿=1 


donde 1 es el vector columna de unos de tamaño n Xx 1. Se dice que A 
es doblemente estocástica cuando es estocástica tanto por filas como por 


columnas. 


Teorema 10.1 Si A y B son estocásticas (doblemente estocásticas), se 


verifica: 
1) AB es estocástica (doblemente estocástica). 
ii) Para todo kE N, AF es estocástica (doblemente estocástica). 
ivi) Cuando A es doblemente estocástica, entonces A? también lo es. 


Teorema 10.2 Si A es una matriz estocástica por filas (columnas), en- 
tonces A=1 es uno de sus valores propios. 


Demostración. 
Sea A una matriz de tamaño nx n tal que A es una matriz estocástica 
por columnas. Basta probar que 


det(A— 1) =:0. 


Para ello, veamos que las filas de la matriz A — Í no son linealmente 
independientes. Si B = A— [, consideremos la suma vectorial de las filas 
de la matriz B: 


arm 1 021 Ani 


a Se 012 a39 — 1 An2 


Qin 02n Ann — 1 
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Es decir, 
lo 421 a] 
> > =>: a12 +49 +... + Mn2 — 1 
din +09 +... + Ann — 1 


Como A es una matriz estocástica por columnas, las entradas de cada 
columna de A suman uno, y por lo tanto 


n 

Y Qi =1 Vi, 

¿=1 
luego, (10.1) se transforma en Bt + Bi o. + Bt = (), es decir, se 
encontró una combinación lineal no trivial de las filas de B = A— I 
que producen el vector cero de IR”. Por lo tanto, las filas de A — Í son 
linealmente dependientes, luego la matriz A — Í es singular, es decir, 
det (A —- 1) = 0 y entonces, A= 1 es un valor propio de 4. Mm 
Definición 10.2 Matriz regular 

Una matriz estocástica A se dice regular si todos los elementos de 


al menos una de sus potencias AF (k entero positivo) son estrictamente 


positivos (mayores que cero). 


Definición 10.3 Cadena de Markov 

Una cadena de Markov, o proceso de Markov, es un proceso en el 
cual la probabilidad de que el sistema esté en un estado particular en un 
periodo dado de observación depende solamente de su estado en el periodo 


de observación inmediatamente anterior. 


Definición 10.4 Probabilidad de transición 
Se define la probabilidad de transición pi (i,j = 1,2,...,n) como la 
probabilidad de que el sistema pase del estado j al estado ¡ en la siguiente 


observación. 
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Definición 10.5 Matriz de transición 

A cada cadena de Markov se le puede asignar una única matriz de 
transición P, cuyos elementos son las probabilidades p;;. Esta matriz es 
cuadrada y su dimensión depende del número posible de estados, la matriz 


P resulta ser estocástica. 


Definición 10.6 Vector de probabilidad 

Un vector de probabilidad es un vector columna con entradas no ne- 
gativas en el que la suma de sus elementos es igual a la unidad. Se dice 
que los vectores de probabilidad X(, para n= 0,1,..., son los vectores 


(n) de 


de estado de un proceso de Markov si la componente de orden 1, p; 
Xx es la probabilidad de que el sistema esté en el estado i cuando se 


hace la observación n. 


Teorema 10.3 Si P es la matriz de transición de un proceso de Markov 


y X( es el vector columna de la observación n, se tendrá que: 


xn) PXtU=D gi P es estocástica por columnas ] 
= 10.2 
Ptx0=D si P es estocástica por filas 


La ecuación (10.2) implica 
x0-px0O 
x0=PX0 =P(PXx0O) = Px0 
X= PS PP) = PRO 
y, en general, 
Xx" =prx0), (10.3) 


Así, la matriz de transición y el vector de estados inicial X(%) determinan 
completamente los demás vectores de estado. 
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Definición 10.7 Un proceso de Markov es regular si su matriz de tran- 


sición es una matriz estocástica regular. 


Teorema 10.4 Si P es una matriz de transición regular de tamaño nXxn, 
entonces cuando n —= 00, P” tiende a una matriz R de tamaño n x n de 


la forma: 
R=(0 0 ... Ul, 


donde UY es un vector de probabilidad de tamaño n x 1, con todos sus 
elementos mayores que cero. 


Demostración. 
El lector puede consultarla en Kemeny é Snell (1976). mm 


Teorema 10.5 Si P es una matriz de transición regular de tamaño n xn 


y R y UY son como en el Teorema 10.4, entonces: 


(1) Para cualquier vector X() de probabilidad inicial, P"XO tiende a 


v cuando aumenta n, esto es 


lím (PX) = 5, 


n—00 


Es decir, todo proceso regular de Markov tiene un vector esta- 


cionario Y. 


(13) El vector estacionario Y es el único vector de probabilidad que sa- 


tisface la ecuación: 
Py =8, 0 (P-1)5 =0. 


Luego, Y es un vector propio de P asociado al valor propio A= 1. 
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Ejemplo 10.1 Una empresa de investigación de mercado estudia un 
grupo de consumidores de café, los cuales compran una lata del grano cada 
semana. Las personas que actualmente toman la marca A, la comprarán 
de nuevo la prórima semana con una probabilidad de 0.50, cambiarán a la 
marca B con una probabilidad de 0.25 y comprarán la marca D con una 
probabilidad de 0.25. De las personas que ahora consumen la marca B, 
preferirán la próxima semana la marca A, B o D con probabilidades de 
0.60, 0.30,0.10, respectivumente. Ahora, de las personas que en la actua- 
lidad compran la marca D adquirirán la próxima semana la marca A, B 
o D con probabilidades de 0.30,0.40,0.30. Suponga que al iniciar el es- 
tudio, la marca A tiene el 20% del mercado, la marca B tiene el 20% y 
la otra marca el 60%. ¿A largo plazo cuál será el porcentaje del mercado 


que tendrán las marcas A, B y D? 


Solución. 
Si se aborda el problema por medio de las cadenas de Markov. 


A B D 
0.50 0.60 0.40 A 
0.25 0.30 0.30 B 
0.25 0.10 0.30 D 


P.= 


Como P es estocástica por columnas, al calcular los valores propios de P, 


se obtienen A1 = 1, A2 = + =- Ya; y Az = = + Y3s, y los vectores propios 
46 1 413 
correspondientes son 41 = |25| yv= |1|+14]| O |, respectivamente. 


20 0 13 


Esto implica que la matriz P no es diagonalizable; sin embargo, 


de: — 185 0 A 
pP"=|2% 1 0 0 E 25 10 
20 0 -v43 0 de 20 0 -Y3 


síssl- o 
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Luego, 

y Taó6 a y37y[1 0 0 E 3 3 
lím P"=|25 1 0 02 2 75 198 -75 
a 20 0 y3 y. E 2043 2043 -71V/3 


Aquí, las potencias de la forma 3n cumplen que 


ta 17” 1.0.0 

1 Ya l _ 1)" 
A PR 
0 20 20 0 0 1037 


ES n . 
y como (0) tiende a cero cuando n — 00, 


46 46 46 
lím P?"=“ | 25 25 925 
a 20 20 20 


Nótese que lím P" da como resultado una matriz con todas sus co- 
n—00 


lumnas iguales al vector de probabilidad correspondiente al vector propio 


46 


asociado al valor propio A= 1. Para convertir el vector propio ví = |25|, 


20 
en un vector de probabilidad, se divide cada una de sus componentes por 
la suma de todos sus elementos, es decir 


v= —Ú' => 
91 91 20 


Por lo tanto, el vector de estados a largo plazo es 


7 46 46 46 5 a 
lím X(WY = lím P.XO=“| 925 25 25 q|- a 
sd ei 20 20 20 ||? ds 


Entonces, se puede decir que a largo plazo la marca A tendrá el control 
de cerca del > = 50.55% del mercado, la marca B el E = 27.47% del 
mercado y la otra marca el > = 21.98% del mercado. 
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Ejemplo 10.2 Supóngase que el clima en cierta ciudad es bueno, regular 
o malo. Si el clima es bueno hoy, será bueno mañana con una probabilidad 
de 0.60, será regular con una probabilidad de 0.20 y será malo con una 
probabilidad de 0.20. Si el clima es regular hoy, será bueno, regular o 
malo con probabilidades de 0.25,0.50, 0.25, respectivumente. Ahora, si el 
clima es malo hoy, mañana será bueno, regular o malo con probabilidades 
de 0.25,0.25,0.50. ¿A largo plazo cuál será el porcentaje de días buenos, 
regulares y malos? 


Solución. 
Se aborda el problema por medio de las cadenas de Markov con 


B R M 
B 0.60 0.20 0.20 
R 0.25 0.50 0.25 
M 0.25 0.25 0.50 


Como P es estocástica por filas, entonces se transpone 


pS 


OUHOUAHOU O 


A o La 
o 


En este caso, los valores propios de P? son Az 


5 2 0 
vectores propios correspondientes son 41 = |[4|,%= | 1| y Uuz3= |-1|, 
4 1 1 
respectivamente. 
Luego, la diagonalización de P? da como resultado 
B-2.07f1 0 07”[5 2 07]? 
(P9"=| 4 1 -1 050 4 1 1 
4 1 1 o 0 Í - 
Dado que (5) y E" tienden a cero cuando n => 00, 
52 0||1 0.0 2.2 2 1 5.5.5 
lim (PJ = 35 [1 1 11 [0 0. 0/[38 5 5[= [44 4 
ts 4 1 1j|0 0 Oj [Oo -13 13 4 4 4 
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Nótese que lím Pad da como resultado una matriz con todas sus co- 
lumnas iguales al vector de probabilidad correspondiente al vector propio 
5 
asociado al valor propio A= 1. Para convertir el vector propio Y, = |4|, 
4 
en un vector de probabilidad, se divide cada una de sus componentes por 
la suma de todos sus elementos, es decir 


Ml lo 1 il 
U= %A=33 |1 
4 


Entonces, se puede decir que a la larga el clima será bueno el = = 38.46 % 
de los días, regular el 3 = 30.77% de los días y malo el e = 30.77% de 
los días. 


10.2 Modelos genéticos 


La relación entre las matemáticas y la biología forma parte de un pro- 
blema antiguo en la historia de las ciencias. Esta sección se ha dedicado 
a una de las aplicaciones de métodos de modelación matemática en ge- 
nética. Para desarrollar este tipo de aplicación únicamente es requisito 
conocer el proceso para diagonalizar una matriz desde el punto de vista 
matemático, ya que también se tendrán que manejar términos propios 
utilizados en el desarrollo de la genética. Para una mejor comprensión, 
se darán a conocer algunas nociones básicas de este tema. Se comienza 
con una reseña histórica muy breve de cómo inició la genética y de cómo 
desde el principio estuvo muy ligada a la estadística; además, se da una 
explicación sencilla de qué es la genética en cuanto a lo que al lector le 
interesa. 

La ciencia de la genética nació en 1900, cuando varios investigadores 
de la reproducción de las plantas descubrieron el trabajo del monje aus- 
tríaco Gregor Mendel, cuya publicación había sido ignorada en la práctica. 
En Mendel (1865) se presenta el resultado de cerca de 10 años de observa- 
ciones minuciosas con la planta del guisante (o chícharo) y se describen los 
patrones de la herencia en función de siete pares de rasgos contrastantes 
que aparecían en siete variedades diferentes de esta planta. En su trabajo 
observó que los caracteres se heredaban como unidades separadas y cada 
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una de ellas lo hacía de forma independiente con respecto a las otras. Esto 
le permitió señalar que cada progenitor tiene pares de unidades, pero que 
solo aporta una unidad de cada pareja a su descendiente. Su investigación 
logró expresarla matemáticamente mediante las leyes de la probabilidad 
y así predijo los resultados de los cruces genéticos, datos que se escriben 
en fracciones o porcentajes. Más tarde, las unidades descritas por Mendel 
recibieron el nombre de genes. 

La observación obtenida al cruzar dos plantas puras con diferentes 
caracteres llevó a Mendel a deducir que existía un rasgo más fuerte, al que 
llamó dominante, y un rasgo más débil o que aparentemente desaparece al 
que le dio el nombre de recesivo. Estos dos conceptos de rasgo dominante 
y recesivo, aunque muy fáciles de comprender, son de vital importancia 
a la hora de desarrollar la parte matemática de esta rama. 

En la historia de la biología este ha sido uno de los experimentos más 
extensos que ha realizado un solo autor. La recepción que tuvo esta publi- 
cación fue prácticamente nula entre la comunidad científica de su época. 
Después de casi cuatro décadas, las leyes de Mendel fueron redescubiertas. 
A partir de entonces, comenzó el desarrollo impetuoso de la genética. Aun 
cuando sea un simplismo, que la comunidad científica ignorara las leyes de 
Mendel, ha costado cuarenta años de retraso a la biotecnología moderna. 

Un gen particular puede ocurrir en varias formas o alelos. Para sim- 
plificar, consideraremos un gen con dos alelos, los genetistas denotan los 
caracteres dominantes con letras mayúsculas y los caracteres recesivos, 
con minúsculas. De esta manera, los alelos serán A y a. 


10.2.1 Herencia autosómica 


En esta sección se considera la herencia como autosómica, esto quiere 
decir que un individuo hereda un gen de cada uno de los genes de sus 
padres, formando así su propio par. Hasta donde se sabe, es el azar el que 
determina cuál de los dos genes de un progenitor pasa a su descendiente. 
Si fuera posible clasificar los individuos de una población de una especie 
dada en cuanto a los genotipos A4, Aa y aa (téngase en cuenta que el 
genotipo Aa es igual que el aA), se podrían determinar las proporciones 
de los alelos en la población. Esto no sería factible si, por ejemplo, no se 
pudieran distinguir AA de 4a. 
Para n =0,1,2,..., se establecen las siguientes proporciones: 


Pn : Proporción del genotipo AA que hay en la generación de orden n. 


dn : Proporción del genotipo Aa que hay en la generación de orden n. 
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Tn : Proporción del genotipo aa que hay en la generación de orden n. 


Si se supone que se pueden determinar esas proporciones, nótese que se 
debe tener 


Pn + Qn +Yn =1. (10.4) 


Entonces, las proporciones u y v de los dos alelos A y a en la población 
satisfacen las ecuaciones 


1 1 
u =Pn + 3 y Y => + Tp. (10.5) 
Aquí, se usó el hecho de que los alelos A y a constituyen el 100% del 
genotipo AA (con proporción pn) y el 50% del genotipo Aa, y simi- 
larmente para los alelos. Si se supone que los genotipos ocurren en las 
mismas proporciones entre los machos y las hembras, entonces u y v re- 
presentan (en toda la población) las probabilidades de que el gen sea A 
O a, respectivamente. 


Ejemplo 10.3 En una población, la distribución de genotipos en la n- 
ésima generación es de 50% de AA, 30% de Aa y 20% de aa. ¿Qué 


proporciones de los genes en esta población son A y a? 


Solución. 
En este ejemplo, p, = 0.50, qn = 0.30 y r,, = 0.20. Por lo tanto, 


1 
u =0.50+ 2 (0.30) = 0.65 y v =0.15+20 = 0.35. 
Es decir, que de la “población” de genes el 65% es de alelo A y el 35% 
es de alelo a. 


Con frecuencia, es interesante el problema inverso al de la determi- 
nación de las proporciones de los genotipos cuando se conocen las pro- 
porciones de los alelos. En general, este problema no tiene solución única. 
El sistema de ecuaciones dado en (10.5) se reduce a una ecuación de dos 
incógnitas, u = Pn + (1/2)q,. Para obtener una segunda ecuación inde- 
pendiente, supondremos apareamiento aleatorio. Esto quiere decir que la 
probabilidad de que un individuo dado se aparee con otro individuo no 
depende del genotipo de este último. En muchos casos, esta es una suposi- 
ción correcta. En otros no; por ejemplo, se sabe que la gente alta tiende 
a casarse con gente alta y, por lo tanto, la característica de la estatura 
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en los humanos no se puede analizar de esta manera. Por otro lado, se 
ha demostrado que la suposición de apareo aleatorio se aplica a la ca- 
racterística de los tipos de sangre humana. La mayoría de los individuos 
escogen su cónyuge sin preocuparse por su tipo de sangre. 

De nuevo, supóngase que u y v son las proporciones de los alelos A 
y a entre los machos y entre las hembras. Entonces, si suponemos que la 
población es grande, la probabilidad de que la descendencia reciba el alelo 
A de los dos padres es u?. De manera similar, las probabilidades de los 
genotipos AA y aa son 2uv y v?, respectivamente. El término 2uv viene 
del hecho de que los alelos 4a y aA son el mismo, hecho que ya se había 
enunciado. Este resultado conduce al siguiente teorema, descubierto de 
manera independiente por Hardy y Weinberg en 1908. 


Teorema 10.6 Ley de Hardy—Weinberg 

Supóngase que en una gran población de padres, los alelos A y a de 
un gen en particular se presentan en las proporciones u yv = 1—u. 
Suponiendo que estas proporciones son las mismas para los machos y 
para las hembras y, además, que el apareo es aleatorio, la primera y todas 
las generaciones sucesivas se compondrán de los tres genotipos, AA, Aa 
y aa en las proporciones u*, 2uv y v?, respectivamente. 


Demostración. 

Como se ha visto, un individuo de la primera generación es de genotipo 
AA si sus dos padres contribuyen con los alelos 4. Como la probabilidad 
es u de que cualquiera de los padres contribuya con un alelo 4, la pro- 
babilidad del genotipo A4 en la descendencia inmediata es de v?. De 
manera análoga, las probabilidades de los genotipos Aa y aa son de 2uv 
y v?, respectivamente. Esto implica que las proporciones p, y q1 de los 
alelos A y a en la primera generación están dadas por 


1 
P1 = 40 + (Quo) = u(u +) =u 
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Por lo tanto, las proporciones de los dos alelos no se afectan por la genera- 
ción inicial. Esto continúa de generación en generación. Concluimos que, 
después de la generación inicial, las proporciones de los tres genotipos 
AA, Aa y aa permanecen constantes en u?, 2uv y v?. Mm 


Ejemplo 10.4 El color de la semilla de chícharo está controlado por un 
par de genes. Los tres genotipos AA, Aa y aa se caracterizan por sus 
semillas de color rojo, rosa y blanco, respectivamente. Si se cultiva un 
campo al azar con 60% de flores rojas y 40% de flores blancas. ¿Qué 
proporciones de los tres genotipos estarán presentes en la cuarta genera- 
ción? 


Solución 

En este ejemplo, u = 0.6 y v = 0.4. Por la ley de Hardy—Weinberg, las 
proporciones de flores rojas, rosadas y blancas en la primera generación y 
en todas las subsecuentes son de u?, 2uv y v?, es decir, 0.36, 0.48 y 0.16, 
respectivamente. Nótese que la suposición de cultivo aleatorio equivale a 
la suposición de polinización aleatoria. 


La ley de Hardy—Weinberg solo es válida cuando el apareamiento es 
aleatorio y cuando los tres genotipos son igualmente probables. En ciertos 
casos, es bastante difícil verificar que el apareo es aleatorio. Sin embargo, 
si las proporciones de los genotipos permanecen constantes durante varias 
generaciones y si satisfacen la ley de Hardy-Weinberg, esto se puede tomar 
como una fuerte evidencia de que el apareamiento es aleatorio. Así, como 
el conocimiento de que el apareo es aleatorio para los tipos de sangre 
humana, también algunas características para las plantas y los animales, 
se derivaron de las observaciones de las proporciones de los genotipos que 
cumplen esta ley. 


10.2.2 Los cuadros de Punnett 


Un cuadro de Punnett es una gráfica que muestra todas las combinaciones 
posibles de genes resultantes del cruce de dos organismos (de quienes los 
genes son conocidos). Se nombran cuadros de Punnett por el genetista 
inglés Reginald Punnett. Él descubrió algunos principios básicos de la 
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genética, incluso la unión del sexo y determinación del sexo. Además, 
trabajó con las características del color de las plumas de los pollos de 
manera separada para pollos machos y hembras. 

Para ilustrar cómo se construye un cuadro de Punnett, se debe tener 
en cuenta que si uno de los padres es del genotipo 4a, entonces es igual- 
mente probable que el descendiente herede de este progenitor el alelo 4 o 
el alelo a. Por otra parte, si uno de los padres es de genotipo aa y el otro 
es de Aa, el descendiente recibirá siempre un alelo a del progenitor de 
genotipo aa y un alelo A o a, con la misma probabilidad del progenitor 
de genotipo Aa. Así, el descendiente tiene la misma probabilidad de ser 
de genotipo AA o Aa. En la Tabla 10.1, se ubican las probabilidades de 
los posibles genotipos de los descendientes para todas las combinaciones 
posibles de los genotipos de los padres: 


Genotipos Progenitores 
Hijos AA-AA | AA-Aa | Ad-aa | Aa-Aa | Aa-aa | aa-aa 
AA 1 J 0 1 0 0 
Aa 0 l 1 5 > 0 
aa 0 0 0 3 > 1 


Tabla 10.1: Probabilidades de los posibles genotipos 


Situaciones en el que el apareamiento no es aleatorio, se presentan fre- 
cuentemente en experimentos biológicos controlados. Un ejemplo evidente 
se da en la cría de caballos de carreras, en la que un ganador probado 
tiene gran demanda como semental. El ejemplo siguiente muestra una de 
las situaciones de apareamiento controlado. 

Ejemplo 10.5 Un agricultor tiene una gran población de plantas con 
cierta distribución de los tres posibles genotipos, AA, Aa y aa. Este hom- 
bre desea iniciar un programa de cultivos en el que todas las plantas de 
la población sean fecundadas por una planta del genotipo AA. Se quiere 


obtener la fórmula de la distribución de los tres posibles genotipos de la 


población, después de un cierto número de generaciones. 
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Solución 
Sean Pn, Qn y Tn las proporciones de los tres genotipos en la generación 
n. Luego, para n= 0,1,2,..., se tiene que 


il 1 
Pn =Pn-1+ 3-15 Un = 3 Mm-1P"Tn-1> a == 0, (10.6) 


Estas ecuaciones determinan la distribución de los genotipos en cada ge- 
neración a partir de la distribución en la generación anterior y se lograron 
establecer por medio de la Tabla 10.1. El sistema (10.6) se puede expresar 
en notación matricial como 


xM -—px0D n =1,2,..., (10.7) 
donde 
Pn Pn=1 1 5 0 
X= lg], X"U= la] y P=|03 1 
e rn—1 0.0.0 


Nótese que las columnas de la matriz P son iguales a las tres primeras 
columnas dadas en la Tabla 10.1. 
La ecuación (10.7) implica 
xO) -Ppx0 
xXx) -—-pPpxU -— P(PxXO) - Px0 
x60) qn PXO) a pP(pP2x0) mn Pio. 
y en general, 
xXM=p"x0, (10.8) 


Así, las proporciones de los genotipos futuros están completamente de- 
terminados por la matriz P y el vector X(O de las proporciones iniciales. 

Ahora, es fácil comprobar que los valores propios de P son Ai = 
1,42 = l y Az = 0, con vectores propios correspondientes: 


1 1 > 
v=|0|, v=|1 y v3z=|-1 
0 0 - 
Luego, P será diagonalizable por la matriz 
11 l 1.0.0 
C=|0 1 -1|, yaquee CAPC=D=|0 3 0 
0.035 0.0.0 
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Por último, como P = CDC”!, se tiene que 
PrelanDa=", 

Este hecho no es desconocido para nosotros, pues 
P=ODrO=, 


Determinar C7! no tiene mayor inconveniente, después de un cálculo 
breve, se llega a 


y como ya se halló C y C7!, y como también sabemos que la matriz D 
es la matriz diagonal que contiene los valores propios asociados a P, se 


tiene que 
1 0 0 
pr= (0 (pro 
0. 0. 0 


de donde se tiene que 


1 1 5 1.0.0 1 1 1 Al 
A II A 
ds o 0 1 oooJp|oo 2 0.0.0 


Nótese que como P es estocástica por columnas, entonces lím P” dio 


n— 00 
como resultado una matriz con todas sus columnas iguales al vector de 
probabilidad correspondiente al vector propio asociado al valor propio 
A=1. 


Por otra parte, 


1 1 1| [po Po +40 +0 1 
lím XW= lim P.XO0=| 0 0 0 | lql|= 0 =|0 
dsd ii 0.0.0]|lr 0 0 


ya que po +40 + To = 1. Así, queda demostrado que a largo plazo todas 
las plantas serán genotipo A4. 
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10.3 Modelo de regresión lineal 


El problema central de la inferencia estadística en una distribución bi- 
variada es determinar la relación entre las variables y conocer de qué 
manera los cambios en una variable afectan la otra. 

La variable que es la base de estimación es convencionalmente llama- 
da variable independiente que se designa por X y la variable cuyo valor es 
estimado se llama variable dependiente la cual se designa por Y. La selec- 
ción de las variables dependiente e independiente se hacen de acuerdo con 
lo conocido y con lo que se desee estimar. En este caso de dependencias 
entre variables, Y es una variable aleatoria pero X no lo es. 

La naturaleza de la relación entre variables se establece a través del 
análisis de regresión. Esta es una técnica con la cual se establece la rela- 
ción funcional entre las variables, de modo que permite predecir el valor 
que toma una variable en función del valor determinado de la otra. La 
regresión es generalmente clasificada en dos tipos: regresión simple y re- 
gresión múltiple o general. 

La regresión simple hace referencia al estudio de las relaciones entre 
dos variables de las cuales una es independiente (X) y la otra es depen- 
diente (Y). 

La regresión múltiple comprende tres o más variables, una de las 
cuales es la variable dependiente que debe ser estimada con base en los 
valores de las otras variables que son las independientes. 


Definición 10.8 Modelo 
Es una relación entre dos o más variables cuantitativas, de tal forma 
que se pueda predecir una variable en función de otra u otras. En este 


punto es necesario distinguir entre dos tipos de relaciones: 
1. Una relación determinística o funcional es de la forma 
Y = (2, 
donde X es la variable independiente y Y es la variable dependiente. 


2. Una relación estocástica o estadística no es una relación perfecta, es 


decir, no proporciona valores únicos de Y para valores determinados 
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de X, pero se puede describir con precisión en términos probabilís- 
Í1COS. 


En el análisis de regresión, se consideran relaciones del segundo tipo, no 
del primero. 
Ejemplo 10.6 La relación entre la variable aleatoria Y y la variable no 


aleatoria X puede ser expresada por: 


Y = Brexp(81X) + e. (10.9) 


La ecuación (10.9) significa que para un valor dado de la variable X, el 
correspondiente de Y es la suma del valor Pp exp (81 X ) más una cantidad 
€. Los parámetros son B0 y B1 y e es la diferencia entre Y y el valor 
esperado de Y condicionada a un valor de X, es decir, 


e=Y —E(Y|X). 


Definición 10.9 Modelo lineal 

Es una ecuación matemática que involucra variables aleatorias ligadas 
por parámetros y que es “lineal en los parámetros”, y en algunas ocasiones 
en las variables aleatorias. La frase lineal en los parámetros significa que 
ningún parámetro en el modelo aparece como un exponente o es multipli- 


cado (o dividido) por cualquier otro parámetro. 


Ejemplo 10.7 Cuáles de los siguientes modelos son lineales: 


(1) Y =M+ Az. (úl) Y =B0+ BV X. 
(iii) Y = 6 +61X. 


Solución. 

Los modelos dados en (+) y (12) son lineales en los parámetros y el 
modelo dado en (14) no es lineal en los parámetros, ya que Pp9 no tiene 
exponente uno. 
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Definición 10.10 Modelo de regresión lineal simple 


El modelo de la forma: 
Yi = Po + B12; + Es, e =1,2,...,M, (10.10) 
donde 


yí : Es el valor de la variable respuesta en el ¿-ésimo ensayo. 
Bo, B1 : Son los coeficientes (o parámetros) de regresión que corresponden 
al intercepto y a la pendiente, respectivamente. 
zx; : Es un valor conocido, el valor de la variable independiente en el 
1-ésimo ensayo. 
es : Es la componente aleatoria, y se conoce como error o perturbación. 


Se dice que es un modelo de regresión lineal simple. El nombre se debe 
al hecho de que es lineal tanto en los parámetros como en la variable 


independiente y simple porque solo se tiene una variable independiente. 


La ecuación (10.10) es una expresión abreviada para el siguiente conjunto 
de n ecuaciones simultáneas: 


y =B0+P1x1 +€1 
ya = Bo + P1T2 + E€2 (10.11) 


Yn = Bo + B1Tn + En. 


El sistema de ecuaciones (10.11) puede escribirse en forma matricial como 
sigue 


Yi 1 21 E1 
Ya 1 za E9 
E l il +|. (10.12) 
: O : 
Un Ll La En 
Y = X Pj+zé 
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Esta última representación permite formular la siguiente definición. 


Definición 10.11 Modelo lineal general 


Un modelo de la forma: 
-1 
y = Y Bay re i¡=1,2,...,.n, (10.13) 
j=0 


donde tp = 1. El sistema de ecuaciones (10.13) puede escribirse en forma 
matricial como sigue: 
Y =X8+£€, (10.14) 


donde: 


Y : Es un vector columna de tamaño n X 1, de observaciones sobre la 


variable dependiente Y. 


X: Es una matriz de tamaño n X p, p < Nn, de cantidades conocidas 
fijas, donde la primera columna es de unos y tiene rango igual a 


k<op. 


al 


: Es un vector columna de tamaño p X 1, de parámetros desconocidos 


Poy Py pde 


£': Es un vector aleatorio o perturbado de tamaño n x 1. 


Se dice que es un modelo lineal general. Este modelo es de rango completo 


si el rango de X es igual a p. 


10.3.1 Métodos de estimación de los parámetros del 


modelo 


Para el modelo dado en (10.14), existen varios métodos de estimación de 
parámetros, entre los que se tiene: 
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e Mínimos cuadrados ordinarios (M.C.O.) 
e Mínimos cuadrados generalizados o ponderados (M.C.P.) 
e Máxima verosimilitud (M.V.) 


En este capítulo se desarrollará una parte del método de M.C.O.; el 
lector que esté interesado en complementar dicho método y en los otros 
métodos, puede revisar el texto de Searle (1971). 


10.3.1.1 Método de mínimos cuadrados ordinarios 


El método de mínimos cuadrados ordinarios se atribuye a Carl Friedrich 
Gauss. Bajo ciertos supuestos, este método tiene algunas propiedades es- 
tadísticas muy atractivas que lo han convertido en uno de los más eficaces 
y populares del análisis de regresión. Son supuestos para su aplicación: 


1. El =0. 


2. Elgs*] =0*L,. 


3. La matriz X es no estocástica, es decir, consta de números fijos. 
4. El rango de X es p(X) = p. 
5. € tiene una distribución normal multivariada, es decir, 
Em N(0, aL): 
El supuesto 1 significa que el valor esperado del vector de perturbaciones 


(desviaciones) £, es decir, de cada uno de sus elementos, es cero. Más 
explícitamente, 3le] = ( significa que 


EY (er) 0 
) e e 1 = y ) (10.15) 
en) LE(en)] lo] 


El supuesto 2 establece que las perturbaciones e; y e¿ no están correla- 


cionadas y, además, que la varianza de e; para cada X; (esto es, la varian- 


za condicional de £;) es algún número positivo constante igual a 0?, es 
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decir, representa el supuesto de homocedasticidad, o igual (homo) disper- 
sión (cedasticidad) o igual varianza. Más explícitamente, E ES t] aL. 
significa que 


2 
E1 Ez 1€92 <=. ElEm 
y Ez E91 ES ... E%En 
ES ] IS [€ EN ee En] = 1 


Le, Désges Enta 2 | 


Al aplicar el operador de valor esperado E a cada elemento de la matriz 
anterior, se obtiene 


E (ei) E(e162) Sci E(e16n) 
O 
E(ens1) Eleneo) ... El(e%) 


La matriz dada en (10.16) se denomina matriz de varianza-covarianza 
de las perturbaciones £;. Los elementos sobre la diagonal principal son 
las varianzas y los elementos por fuera de la diagonal principal son las 
covarianzas. Por definición, 


E( le: — E(c;)] [e; - E(es)]) = l El eN 7 


pero debido a los supuestos E(e;) = 0), para cada 1 y E(e,e;) =0sii1X J, 
la matriz (10.16) se reduce a 


a 0 0 

0. 072... 0 
A E (10.17) 

0 0 q? 


El supuesto 3 estipula que la matriz X de tamaño n x p es no-estocástica, 
es decir, consiste en un conjunto de números fijos. 

El supuesto 4 establece que la matriz X tiene rango columna completo, 
es decir, es igual a p, al número de columnas de la matriz. Esto significa 
que las columnas de la matriz X son linealmente independientes, es decir, 
no hay relación lineal exacta entre las variables X. En otras palabras, no 
hay multicolinealidad. 
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10.3.1.2 Forma operativa 


Este método consiste en determinar los valores de los parámetros 8; de 
tal manera que la suma de cuadrados del error (SCE) sea mínima, es 
decir, se minimiza 


SOE= SE =5te=(Y -XB) (Y -—X8) (10.18) 


¿=1 


con respecto a P. Las derivadas parciales de £t£' con respecto a B dan 


des _ IX XÓ — 2X'Y. 


Si se iguala al vector nulo, se llega a las ecuaciones normales de la teoría 
de M.C.O. 
X'X86 =X"Y. (10.19) 


Cuando X'*X sea no singular, premultiplicando por 6.429 e se tiene 
MCO(8) =P = (Xx) "XY =0Y, (10.20) 


donde C = (ax) xi, Otras estimaciones para el modelo (10.14) me- 
diante el método de M.C.O. son 


SCE == [(1,- DY, EY =Y(1,-mY (10.21) 
SCT =Y'*(In — Jn)Y 
SOR=SCT —SCE =Y*(H — Jn)Y (10.22) 


La penúltima expresión se tiene del Ejemplo 5.5. 


Obsérvese que la matriz H = X(X'x) "Xi, la cual en la literatura 
estadística se conoce como “Matriz Hat”, determina muchos de los resul- 
tados de las estimaciones por M.C.O. Por ejemplo, cuando premultiplica 
al vector de respuestas Y, se obtienen las predicciones de la variable de- 
pendiente, por eso en algunos textos de estadística la denominan Matriz 
de predicción y a la matriz [,, — H la llaman Matriz residual, puesto que 
al anteponérsele a la variable dependiente Y, se obtienen los respectivos 
residuales. 
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10.3.1.3 Propiedades de los elementos de la matriz H 


La matriz H = [h;¿] de tamaño n x n cumple que 


a) hi = YN 2, A ARA 
¿=1 


b)0<%.< Ll, s12=1,2.. 

c) —0.5< hij < 0.5, para 1H j. 

d) (1 hu) (1 hy3) — haz > 0. 

e) hash; — hoj >0 

f) Si hi; = 1, entonces h;¿= 0, para todo j¡ H 1. 


Si la matriz X de tamaño n x r es de rango r, entonces 


g) a > Y 2, =p=t10(B). 


4=:1 1=13=1 


Además, como h;¿= 2; (XX) > LD; , hi está determinada por la localiza- 


ción de x; en el espacio X. Es decir, un pequeño (grande) valor de hy; 
indica que 1; se encuentra cerca (lejos) de la masa de los otros puntos. 


Ejemplo 10.8 Ajuste el modelo de regresión: 


Yi = Po + P1T15 + Ej (10.23) 


al conjunto de datos hipotéticos de la siguiente tabla: 


Xi y Xx y x1 y 


1  -10 gg -2 9.6 


2 8 6 0 10 8 
3-6 7 2 11 10 
4 4 8 4 


10.4. Multicolinealidad 433 


Solución. 
Si se expresa el modelo dado en (10.23) en la forma matricial dada 
en (10.14), se tiene 


Y =X8+£, (10.24) 


donde X = [Xo Xi] y Xy =1. Al calcular (XX), se tiene que 
(xex) = e ne ti P o 


Luego, las ecuaciones normales (10.19) son 


630-1300 e 


En el Ejemplo 7.8, se obtuvo que el (A) = 218.9, luego, existe multicoli- 
nealidad moderada, es decir que variaciones muy pequeñas en la varianza 
de la variable regresora Xy produce cambios drásticos en las estimaciones 
de los parámetros. 

Sin embargo, se puede establecer la solución de (10.25) como sigue: 


COS 


Así, el modelo de regresión es 


qa 1040. i=1,2,...,11. 


10.4 Multicolinealidad 


La multicolinealidad se refiere a la existencia de más de una relación lineal 
exacta. Inicialmente, este término significó la existencia de una relación 
“perfecta” o exacta entre algunas o todas las variables explicativas de 
un modelo de regresión. Para la regresión con p variables que incluye 
las variables explicativas Xp, X1,..., Xp (donde Xy = 1 para todas las 
observaciones que den cabida al término intercepto), se dice que existe 
una relación lineal exacta si se satisface la siguiente condición: 


o0X0+01X1+...+0pXp =0, os ER, (10.27) 
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donde algunas constantes no son iguales a cero. 

Sin embargo, el término multicolinealidad se utiliza también para el 
caso en el cual las variables Xp, X1,..., Xy están intercorrelacionadas 
pero no en forma perfecta, de la siguiente manera: 


ata bas += 0, (10.28) 


donde »; es un término de error estocástico. 
En los textos de econometría se emplea como medida para detectar 
la multicolinealidad, el índice de condición, de la siguiente manera: 


Ss 0 <IC(X'X) < 10 no existe multicolinealidad, 
10 <IC (x"x) < 30 existe multicolinealidad entre moderada y fuerte, 
30 <IC (XxX) existe multicolinealidad severa. 


10.4.1 Soluciones al problema de la multicolinealidad 


10.4.1.1 Regresión por componentes principales 


Una solución que muchas veces se sugiere para el problema de la multico- 
linealidad es la regresión por componentes principales. Supongamos que 
se tiene un conjunto de p variables explicativas, X1, X2,..., Xp. Entonces, 
se construyen funciones lineales de estas variables 


Zi =0123 +0ap9X3 +... + QipX;, A (10.29) 


con X = E, de tal manera que un grupo m (m < p) de las va- 


2 
riables Z1,Z2,..., %p contengan aproximadamente la misma información 
que X1, X2,..., Xp. Las variables 21, Za,..., 4) se buscan de manera que 


1 Col 2 =0,03 = Lc pit 


(11) Var(Z1) > Var(Z2) a Var(Zp). 


(iii) Z, =a(X, para i=1,2,...,p y está sujeto a la condición de que 
[a/a = a; =1, (10.30) 
t 
donde al = (a:1,0;2, aii sd) y X, = [X7 Ma X;] z 
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La matriz de covarianzas de X, es S = E(X,X1), la cual es una matriz 
simétrica definida (o semidefinida) positiva y de orden p. Como 


Var(Z;) =E(2,2,) =E(X,Xd;) = ¿E(X,X()Jd; = Sa; 


para hallar Z1, se necesita conocer el vector de coeficientes d1, y para 
ello, puesto que la varianza de Z1 debe ser mayor que la varianza de las 
restantes componentes, habrá que resolver el problema de optimización 

máx F(d1) = asa, 

aa =1. 

Por lo tanto, consideremos la maximización de la forma cuadrática a Sa, 
sujeta a la condición (10.30). Si se introduce el multiplicador de Lagrange 
9, se maximiza 

a, Sá, — (ad - ya 
Al diferenciar respecto a 41, 0 e igualar a cero las derivadas, se obtiene 

28a, — 264, =0 y da, —-1=0. 
Por lo tanto, 
Sar = 041 y ad; = Ll; 


Este sistema tiene como soluciones todos los vectores propios de la matriz 
S de norma 1 asociados a cada uno de los valores propios de S. 

Sean Ar > A2 > ... > Ap los valores propios de S (la positividad 
estricta de los valores propios A; está garantizada si S es definida positiva) 
y Ul,U2,...,Up los correspondientes vectores propios de S normalizados. 
Entonces, los puntos estacionarios del problema son 


Jo > 0 
a =Uj, JE LL 29D, 


con multiplicadores de Lagrange asociados 
di = Aj, j=lL iio, po 


Entre todos estos puntos estacionarios, el máximo se alcanza en el que 
coincide con el vector propio de S correspondiente al valor propio domi- 
nante!. 

Además, como Y, es un vector propio normalizado de S, la forma 
cuadrática a;Sa; = Aj, de lo cual se deduce que 


Var LA = Aj- 


1 De hecho, hay que considerar Ay > Az, ya que si Ay = Az, entonces los vectores 


propios Y, y Ya asociados son ambos solución del problema del máximo. 
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10.4.1.2 Propiedades de los componentes 


Los componentes principales tienen las siguientes propiedades: 


(a) La suma de los primeros k valores propios dividida por la suma de 
todos los valores propios, es decir, 


M+FA2 HF. ..+FAz 
AM+A2+...+ Ap 


representa la “proporción de la variación total” explicada por las 


primeras k componentes principales. 


(b) Las componentes principales de un vector aleatorio son invariantes 
a los escalares. 


(c) Si la matriz de covarianza S tiene rango r < p, entonces la variación 
total de S puede ser explicada enteramente por las primeras r com- 
ponentes principales. 


(d) El subespacio vectorial formado por las primeras k componentes 
principales 1 < k < p tienen la desviación cuadrática media más 
pequeña de las variables de la población (o muestra) que cualquier 
otro subespacio k-dimensional. 


(e) Como un caso especial de (d), para k = p— 1, el plano perpen- 
dicular a las últimas componentes principales tienen la desviación 
cuadrática media más pequeña de las variables de la población (o 
muestra) que cualquier otro plano. 


Ejemplo 10.9 Ajuste el modelo de regresión: 
Yi = Po + P121; + Pa22 + Ej (10.31) 


al conjunto de datos hipotéticos de la siguiente tabla: 


X1 X2 y Xx X2 y XI X2 y 


1 1  -10 9 9 -2 9 17 6 


2 3 8 6 11 0 10 19 8 
3.05 0-6 7 18 2 11 21 10 
E E El 8 15, 
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Solución. 
Si se expresa el modelo dado en (10.31) en forma matricial, se tiene 


Y =X8+£, (10.32) 
donde 
Xx=D6 14 20 


Aquí, Xy = 1 para todas las observaciones que den cabida al término 
intercepto, de modo que las ecuaciones normales son 


SO a=XF, (10.33) 


Al calcular (XX), se tiene que 


11 66 121 1.6 11 
(XX) =| 66 506 96 |=11| 6 46 86 
121 946 1771 11 86 161 


Si se reescribe (10.33), se llega a 


1 6 117 [6 0 1 6 117 [6 0 
1116 46 86| |6,| = j220| => |6 46 86| |6,| = |20 
11 86 161] |, 440 11 86 161] |5, 40 
(10.34) 


Primero se determina si el sistema de ecuaciones obtenido en (10.34) es 
estable. Para ello, se debe calcular el número de condición dado en (7.6), 
por lo tanto, se necesitan los valores propios de la matriz (OL 


Plxx) (A) = —A% + 22884? — 72604 =—A(A? — 2288A + 7260), 


de donde los valores propios son 
A1 = 11(104 + 242689), A2=11(104—2v2689) y  Az=0. 
Luego, el número de condición es muy grande, ya que 
Az 
XxX) =T. 
(xo) =) 


En este caso, se dice que existe multicolinealidad severa, es decir, varia- 
ciones muy pequeñas en las varianzas y las covarianzas de las varia- 
bles regresoras X; producen cambios drásticos en las estimaciones de los 
parámetros. 
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En el Ejemplo 9.18, se concluyó que el sistema dado en (10.34) era 
consistente indeterminado, y se obtuvo la siguiente solución: 


1 
B| =3 [10]. (10.35) 


Como el sistema es consistente indeterminado, se utiliza el análisis de 
componentes principales para determinar el coeficiente 9, más significa- 
tivo, y para establecer dicho coeficiente, se construye la matriz: 


1 
n= 1 


N= 


X(L, — Jn) XK. 


Al efectuar los productos descritos anteriormente, se llega a 


y con los elementos de 2 = [0;;] se forma la matriz S = [s¿;] , donde 


A 
Sij = A 
vOm0jj 
Luego, 
11 22 
S= 11 ans | E q 
NN 22 44 = 1 1 z 
(11)(44) li 


Los valores propios de la matriz S son A¡ =2 y A2 = 0, y sus respectivos 


oa lena A a IA 
vectores propios normalizados son Uv] = WE Í y Va = Wo 1 A 


Por lo tanto, las componentes principales son: 


y dado que 
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entonces la componente principal Za tiene media O y varianza cero. El 
último resultado también se puede obtener de la definición de varianza, 
así: 


Var[Z:] =Var| 5(%5 Xi) = ¿Var(X3 Xy) 


[Var(X3) + Var(Xi) —- 2Cov(Xj, X3)|] 


=3[1+1-2] =0=2. 


N|=Rn|Re 


Var [Zo] = 0 identifica la función lineal como el origen de la multicoli- 
nealidad. Luego, es posible decir que Z2 > 0, lo cual da que Xf = X3. Si 
se realiza la regresión de X2 sobre X1, es decir al expresar, 


22 = Q0 + 0115, 
se obtiene que 
ca =-1+251;. 


Como existe una relación exacta entre X2 y X1, no es posible estimar 
por separado los coeficientes de X1 y X2. Por lo tanto, si en la ecuación 
original (10.31) se sustituye 12, en términos de x1;, se obtiene 


y = Bo + Prrr + Pa(-1 4 2x11) +€s 
=(%0 Ba) + (Br + 282) 11 + Ej. 


Esto da lo que en estadística se denomina funciones lineales estimables 
de 6, que son 


Bo—ba y B1+28. (10.36) 


Finalmente, en el Ejemplo 10.8 se obtuvo la regresión de y sobre x1, lo 
cual dio como resultado que 


yí = -12+ 2214, 
es decir, 
Bo — fa = —- 12 y B1+282 =2. 


Este sistema expresado matricialmente queda 


AI 
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Luego, una solución sería 


Bb] [2 
B| =| 2 (10.38) 
Ba 0 


Por otra parte, si en la ecuación (10.31) se sustituye x1, en términos de 
19, se llega a 


xo + 1 
Yi = BoA al 5 ) E Patos + Es 


=(6 +3) | (30 do Joa + 


Luego las nuevas funciones lineales estimables de 8 son 


hor 5h y =Ó1+ bs (10.39) 


En este caso, la regresión de y sobre 2 da como resultado que 


yi ==11 + 9, 
es decir, 
o 1. s 
Bo + ¿61 =- 11 y 341 +62 = 
Este sistema expresado matricialmente queda 
Do 
1.05 0 > -11 
E 0.5 La [Y pd 
y 
Una solución sería 
Bb] Fu 
Bip =| 0]. (10.41) 
Ba 1 


Dado que se obtuvieron dos soluciones distintas (10.38) y (10.41) para 6, 
entonces se usa la inversa generalizada para resolver el sistema (10.37), y 
se obtiene que la estimación de 3 viene dada por 


BT 11527139 1 [550 
Bl=5|2 2 || =3|-20/- (10.42) 
Ba ala 16 
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Nótese que este último vector coincide con el obtenido en (10.35). 

Como lo indica este ejemplo, la multicolinealidad revela que no es 
posible estimar los coeficientes individuales de manera precisa, pero que 
sí se pueden calcular algunas funciones lineales de los parámetros. 


10.5 Selección de carteras 


En Markowitz (1952, 1959), se presentó una técnica de selección de 
carteras que llegó a ser llamada la teoría moderna de cartera (M. PT, por 
su sigla en inglés). En esta teoría, se asume que los rendimientos esperados 
de los activos de la cartera tienen una distribución normal multivariante, 
supuesto análogo a las otras teorías que forman la base de las matemáti- 
cas financieras tradicionales. Este supuesto es una primera aproximación 
que da lugar a teorías analíticamente tratables. La optimización de las 
inversiones en el contexto media-varianza, se ha convertido en una de las 
herramientas con más aplicaciones en las decisiones financieras en sentido 
amplio. Para llevar a cabo la optimización de carteras, el inversor puede: 


e Elegir un nivel de riesgo (volatilidad) dado, dependiendo de su aver- 
sión a este y buscar la cartera que mayor rendimiento le ofrezca. 


e Seleccionar un rendimiento esperado y buscar la cartera que mini- 
mice el riesgo. 


En esta sección se presenta el problema de decisión de selección de 
carteras. La cartera de mínima varianza es de interés particular, ya que 
las ponderaciones de los activos son determinadas a partir de la matriz 
de varianza-covarianza. 


10.5.1 Formulación matemática 


Suponga que hay m activos riesgosos, el rendimiento esperado del ¿-ésimo 
activo es denotado por E [ra], la covarianza de los rendimientos entre el ¿- 


ésimo y j-ésimo activo es expresada como 0;;, y la varianza del rendimien- 
to del ¡-ésimo activo es denotada por 0;; = 07. Además, se asume que 
ningún activo puede expresarse como una combinación lineal de los otros 
activos, entonces la matriz de varianza-covarianza de los rendimientos, 
Y = [0;;], es no singular. La frontera de todas las carteras factibles que 
pueden construirse con estos m activos se define como el lugar de carteras 
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factibles que tienen la variación más pequeña para un rendimiento esper- 


ado prescrito. Sean w, (i= 1,...,m) constantes que determinan la pon- 
m 

deración de cada activo dentro de la cartera de tal forma que > w, = 1, 
¿=1 


es decir, w, se puede interpretar como la proporción de riqueza invertida 
en el ¿-ésimo activo. No se consideran ventas en corto y, por lo tanto, el 
rango de valores permitido para cada w, se restringe al intervalo [0, 1]. 
Dada la matriz de varianzas-covarianzas », la cartera de varianza 
mínima global (GMV P, por su sigla en inglés) es la cartera con pondera- 
ciones 4 = [w;] que soluciona el siguiente problema de optimización: 


mín 0% = mín 0'Yv, (10.43) 
w w 
sujeto a la condición 
wl,=Ño=1, (10.44) 


donde w es el vector columna de tamaño m Xx 1 cuyos elementos son las 
ponderaciones de la cartera, y al formar el lagrangeano, se tiene 
L = 07-—20(w'1,, —1) 
0) 


Lf[ = 256-201, (10.45) 
0% 


donde d € R es el respectivo multiplicador de Lagrange. Al igualar a cero 
la ecuación (10.45), se tiene 


3uw = ól, Y = 
> =1 o >t t -1 
wW =0% “l,, wW =01,» 7, 
y multiplicando esta expresión por la izquierda por 1%,,, se obtiene que 
ps is)” (10.46) 


Si el modelo fue correctamente descrito para la varianza-covarianza condi- 
cional, entonces se esperaría que la variación de cualquier cartera con 
ponderaciones W sea Na. Las variaciones de la cartera que son tam- 
bién relativamente pequeñas para la varianza pronosticada son indicio de 
exceso de correlación, mientras variaciones que son demasiado grandes 
indican subestimación de la correlación. Luego, al sustituir en (10.43), se 
llega a 
%p =4, 

donde T%p denota la varianza mínima y bajo las condiciones dadas o 
restricciones consideradas, y está determinada de manera única y solo 
depende de la matriz >. 
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10.5.2 Cartera con rentabilidad preestablecida 


En este contexto, se supone que a los inversores solo les preocupa el 
rendimiento esperado (su media) y la varianza de dichos rendimientos 
(riesgo). En este caso, la GMVP estará conformada por las pondera- 
ciones 4 que minimizan la varianza de la cartera para el nivel de rentabili- 
dad esperado fijado por el inversor, por lo que el problema de optimización 
a resolver en el caso de m activos es el siguiente: 


mín 0% = mín Ev, (10.47) 
w 


pero sujeto a las restricciones 


WE(r) = E) = E 
wLli=0= 1, 


donde E(r) es el rendimiento esperado, E es el rendimiento mínimo es- 
perado de la inversión y w es el vector m x 1 de ponderaciones. En forma 
matricial, estas restricciones quedan 


EE a Al (10.48) 


y al establecer el lagrangeano, se obtiene 


L = 5635-21 (w'E(r) - E) — 282(5'1 —1), 


donde 0,,02 € R son los multiplicadores de Lagrange. Las condiciones 
estándar de primer orden para un punto crítico son 


a) 


55L =2E0- 261 2(1) — 2691, =Ú (10.49) 
Se =w'E(r) -E=0 
e = úl, —-1=0, 
por lo tanto 
5 =6/E(r) + 021 (10.50) 
w=05,E E(r) +0, 5 1,. (10.51) 
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Para determinar los multiplicadores de Lagrange que satisfacen (10.49), se 
multiplica por la izquierda la ecuación (10.51) por el vector de rendimien- 
tos esperados transpuesto y se obtiene 


e E 


Er) 6 =E(r) (0,87 E(r) + 68751) 
E =5,B+034. (10.52) 


Por otra parte, si se multiplica por la izquierda la ecuación (10.51) por 
un vector de unos transpuesto, se llega a 


1,0 =1*, (6,5 E(r) +05*1,) 
1 =6,4* + 92C. (10.53) 


Las expresiones (10.52) y (10.53) forman un sistema de ecuaciones, y al 
reescribirlo matricialmente, se tiene 


BATA TE 
At Ci ||ó] 11] 
y la solución sería 


AT SS 1E]. coso 


donde las constantes A, B,C y D son definidas? como en Merton (1972) 


A= E(M3 En, B= Elr) 37 Ef), (10.55) 
C = e D= BO=AA | 


Al multiplicar el lado izquierdo de la expresión (10.50) por w%* y susti- 
tuir (10.54), se obtiene que la varianza mínima de esta cartera es 


Eo = | E(r) 1, | | A | 


> [5 ¡e! il (10.56) 


2 Las cantidades B y C' son formas cuadráticas de N”*, luego son estrictamente 
positivas mientras que A es una forma bilineal simétrica de N7?. 
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Por otra parte?, como A = 4%, sustituyendo las relaciones (10.55), se 
tiene que 


t 


271, —E(r) E (10.57) 


e 
m 
== E(r) 


y al sustituir en (10.51) las expresiones obtenidas en (10.57), se llega a 
E > ' 
o ==" [e 1») 


a > 256) 2) [tn -E()] 37 [Ln —E()] H 


= o [Ln —E(r)]| | 


donde la matriz antisimétrica 


K=|EG) 1m] [Im -E()] = EG), — 1nE(r) 


será igual a la matriz nula solo cuando todos los rendimientos esperados 
de los m activos sean iguales. Obsérvese que en estas ponderaciones ya no 
aparecen los multiplicadores de Lagrange; además, si se sustituye (10.48), 
se obtiene 


1-1 1 7 a ; 
a =D tk l1, —E(+)| [E(r) 1] 0 
= DISTKE TK =-—D US. (10.58) 
Reescribiendo esta última expresión, se llega a 


(Ex) (-D)1,] 3 =0 
[357 K —iVDI,] [8 *K —ivVDI,]ú =0, 


donde ¿, 1 (6.3 = 1) representan la unidad imaginaria y su conjugado com- 
plejo, respectivamente. Puesto que el vector de ponderaciones w € R”, 
este se construye realizando una combinación lineal de las correspondien- 
tes partes real e imaginaria del vector propio complejo, u € C””, asociado 
al valor propio iw.D de la matriz N7|K. 


3 


Nótese que como estas dos formas cuadráticas son equivalentes y D es el de- 
terminante de la matriz simétrica asociada a la forma cuadrática del lado derecho, 
entonces es positivo. 
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Expresando el vector de ponderaciones como una combinación lineal 
de las correspondientes partes real e imaginaria del vector propio complejo 
ue C”, se tiene que 


a= hw [E() tn] A | (10.59) 


donde A =1*,WK(r) y 


W = [Re(1) Im(ú)] 5 > [Re(2) Im(a)]'. 


10.5.3 Cartera mínima con rentabilidad preestablecida 


Al reescribir la forma cuadrática dada en (10.56), se tiene que 


¿Yu = 5 (0E 2A4E + B) 


= > 6 iS 2) + ol (10.60) 


Luego, la frontera en el espacio media-varianza está determinada por la 
siguiente ecuación cuadrática: 


2/- A 2 
CúéYEw — S(E - $) =1, (10.61) 


Esta cónica representa una hipérbola con centro en (0, 2), con vértices 


y focos sobre la recta horizontal Emín —= A y asíntotas dadas por 


= A D 
E = GEN GO con o =vutNXu. 


Si se sustituye en (10.54) el valor mínimo Emín, se obtiene que 


1 
01 =0 Y 02 = C” 
y al reemplazar en la ecuación (10.51), se reduce a 
A 
u= ¿Y A (10.62) 


Luego, al sustituir en (10.47), se llega a 
Okp = 09. 


Nótese que estos resultados son los mismos que se obtuvieron en la 
sección anterior. 
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Figura 10.1: Frontera eficiente. 


Ejemplo 10.10 Modelo de inversión 
Considere tres categorías de inversión: acciones (11), bonos (12) y 
activos inmobiliarios (13). Suponga que el rendimiento mínimo esperado 


es de E =9 y la matriz de varianza-covarianza es 


92 3 2 
4 "25 20 
y — 3 16 42 10% 

25 25 125 |?” (10.63) 
9 42. 36 
20 15 2 

E : : t 

y que los valores de los rendimientos medios es E (2) = E E 2] ; 


Determine las ponderaciones en cada una de las categorías de inversión 


para que el riesgo sea mínimo. 
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Solución. 


En este caso, se establece primero la matriz K, para ello 


54 54 54 54 
En 13) 5 a] pa) 
(11 =|(/1 1 1=|2 
19 19 196 19 
2 2 2 2 
54 38 19 
ri 1 Sa 
A = 54 38 19 | 54 38 19 
1E(r) = M1 1% $ 3]|= A hd 
1 34 38 19 
5 5 2 
Por lo tanto, 
54 54 54 54 38 19 
K-=-|3% 3 38 4 38  Í an 32 0 -19 
5 5 5 5 la] 2 — 
bp bb 34 $8 B| Yl3 1-9 0 
2 2 2 B 5 2 


52 25 38 16 13 _353 5683 1681 

105 126 1 y 5 10 945 4725 6300 

SK — 20 625 188 _16 0 _19 == 6% “18% _6605 
e IN CI 19% 1806 5 

189 252 63 10 1 42 1890 7560 


Luego, la ecuación característica es 


754469 
2 - 
AA e) e 


Para evitar trabajar con complejos, se puede elevar la matriz N”*K al 


cuadrado y calcular los valores propios y vectores propios respectivos, en 
este caso 


_353 5683 1681 ]2 _124991 11191 _105013 
945 4725 6300 20412 “20412 “2721 
Sra a se7 168 8 _ 5804 87933 7185 
> 4 4 “2016 = 2721 72 27.21 > 
19% 1008 US 2893 CES 
42 1890 7560 1701 5103 81648 


luego, la ecuación característica es 


44697? 
ap E il mn 


81648 


y al calcular el vector propio correspondiente a A¡ = 0, se tiene 


0 =|[19 13 -32), 


10.5. Selección de carteras 449 


los vectores propios correspondientes a A2 = 0 208 son 
y prop Y DA 81648 
124 5527 
Va = |705 y 03 NN 0 
0 4465 


Luego, w debe ser una combinación lineal de los vectores propios asocia- 
dos a este valor propio no nulo, por lo tanto, 


W = eE dl ba ñ es 705 0 
o 465 | LU? 0) 15527 0 4465 


0 -16581 2356 
= 235 | 16581 0 13395 
23596 -13395 0 


Al realizar el producto dado en (10.59), se obtiene 


0 -16581 2356 9 243914 
16581 0 13395 7| = 369433 |, 
5 
2 


2356 -13395 0 754469 [145199 


El 


— 754.469 


es decir, la cartera Óptima en que el inversor debe invertir está formada 
aproximadamente por un 32.33% en acciones, un 48.44% en bonos y un 
19.23% en activos inmobiliarios. Con estas ponderaciones se puede ver 
cómo existen claras ventajas en la diversificación de la cartera, es decir, 
combinando los activos disponibles, se logra disminuir parte del riesgo 
(varianza). El riesgo de la cartera Óptima es 


9.3 9 243914 
ou =| Tóqaóo 7sad9 Toidoo ) | “95 2 195 041 
$ BD E (28193 
20 125 25 1754 469 
49001031 
— 2001031 21058. 
94.308 625 


Nótese que la varianza de la cartera Óptima (0.51958) es inferior a las 
otras tres varianzas de los intrumentos de inversión considerados por sí 
solos (ver diagonal de la matriz de varianza-covarianzas). 

Este problema puede solucionarse mediante métodos numéricos, em- 
pleando un modelo de programación no lineal (NLP), puesto que la fun- 
ción objetivo fue expresada empleando una forma cuadrática. 


Apéndice A 


Métodos iterativos para 
estimar valores propios 
y vectores propios 


En el Capítulo 2 se estudio un procedimiento para encontrar los valores 
propios de una matriz A = (a;;], que era resolver la ecuación característica 
asociada. En muchos problemas prácticos, obtener las raíces correspon- 
dientes del polinomio pa(A) no es sencillo. Es más, en algunos problemas 
estadísticos solo se necesita el valor propio con el valor absoluto más 
grande. En este apéndice se trataran algunos métodos para calcular va- 
lores aproximados de los valores propios de una matriz. 


A.1 Valor propio dominante y vector propio do- 
minante 


Definición A.1 Valor propio dominante y vector propio domi- 
nante 

La matriz A de tamaño n x n tiene un valor propio dominante si el 
valor absoluto de este es mayor que los valores absolutos de los valores 
propios restantes. El vector propio asociado al valor propio dominante se 
denomina vector propio dominante. 


Ejemplo A.1 Determine el valor propio dominante para la matriz: 
2 
4=l5 4] 
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Solución. 
Los valores propios asociados a A son -1 y 6. Por lo tanto, el valor 
propio dominante es 6. 


Ejemplo A.2 Determine el valor propio dominante de la matriz: 


4 2 2 
A=|8 10 -14 
8 8 -12 


Solución. 
Los valores propios asociados a la matriz A son 2, -4 y 4. Por lo tanto, 
no hay valor propio dominante. 


A.1.1 Método de la potencia 


El método de potencias para aproximar valores propios es iterativo. 
Primero, se supone que la matriz A tiene un valor propio dominante 
con vectores propios dominantes. Luego, se elige un vector diferente de 
cero 1 € IR”. Por último, se forma la sucesión definida por 


A medida que k crece, A*1, se hace paralelo al vector propio dominante 


de A. 


Teorema A.1 Sea A una matriz real diagonalizable de tamaño nx n con 
valores propios reales A1,A2,..., An tales que 


Entonces, existe un vector 1%, diferente de cero de R" tal que la sucesión 
de vectores definida por 


> 2 3> k > 
Av, A Di, A Wi... ¡A Wi... 


se aprorima al vector propio dominante de A cuando k aumenta. 
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Demostración. 

Como A es diagonalizable, entonces existe una base de R” formada 
por los n vectores propios (11, Ux,...,U,) asociados a los valores propios 
Ai, 1 =1,2,...,n, respectivamente. 


Sea 1, cualquier vector distinto de cero de |R”, de forma que 


n 
wi = yA C¿Us, con Cc; ER. (A.1) 
=1 


Definamos el siguiente proceso iterativo: 


Wry1 = A Wr, h= Lis 
Nótese que 0 +1 = AFW, k=1,2,... Por lo tanto, se tiene que 
n n 


en general, por recurrencia, se obtiene 


n k 
e E a MN 
de añ + » 03%) a 
i=2 


Luego, con base en la hipótesis original de que A¡ es mayor en valor 
absoluto que los demás valores propios, se concluye que cuando k tiende 


a infinito, cada una de las fracciones [3] para 1 > 1 tiende a cero, pues 


IS 


< 1. Esto implica que la aproximación 
= ere 0 
y +15 AjC1U1, c1 F0, 


mejora a medida que k es suficientemente grande. Como 4; es el vector 
propio asociado a A1, entonces es dominante; luego, cualquier múltiplo es- 
calar de 41 también es un vector propio dominante. Así, se ha demostrado 
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que A*15, se aproxima arbitrariamente al vector propio dominante cuando 
k crece. MM 


Como las componentes de 4%, pueden ser números muy grandes al 
aumentar k, esto conduce a un error de redondeo. Este problema se evita 
multiplicando 4*%, por un escalar adecuado en cada iteración. 


A continuación, se presenta un procedimiento para obtener el valor propio 
dominante de una matriz A. 


Cálculo del valor propio dominante de A 


i) Seleccione un vector arbitrario diferente de cero %,, cuya 
entrada más grande sea 1. 


1) Para = 1, Zión. 


a) Calcule 4%. 


b) Sea uz el elemento de A con valor absoluto más 
grande. 


c) Evalúe Wx+1 = AD. 
iii) Para casi todas las escogencias de 51, la sucesión (1z ) tiende 


al valor propio dominante y la sucesión [107 ) se aproxima al 
correspondiente vector propio. 


Con esta metodología no hay reglas eficaces y rápidas para determinar 
cuántas iteraciones se deben realizar. Si se escoge el vector 4, de manera 
que en la expresión (A.1) el coeficiente c¡ sea cero, el método falla. 


Ejemplo A.3 /lustrar el método de la potencia para la matriz dada en 
el Ejemplo 2.1, comenzando con wi = [1 1]. 


Solución. 


Aplicando el método de la potencia de tal forma que en cada resul- 
tado no se utilicen cifras decimales para evitar redondeos, se obtiene lo 
siguiente: 
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k 1 2 3 4 5 6 7 
1 7 41 247 1481 
Dr 1 3 17 103 617 3703 0.4 
1 ál 1 1 1 1 1 
3 7 41 247 1481 8887 2.4 
Ar MN El Ed Ei Ea Ea : a 
3 17 103 617 3703 ] 
17 103 617 3703 
Ar y E) 3 17 103 “617 5.9997 


Luego, el valor propio dominante es aproximadamente 5.9997 y el respec- 
tivo vector propio es [0.4 1]. 
Las respuestas exactas son 


A=6 y Yi =|[0.4 1]. 


Definición A.2 Cociente de Rayleigh 
Sea A una matriz real diagonalizable de tamaño n x n, se llama co- 
ciente de Rayleigh de A a la función real definida para cada Y 4 0 como 
eN CAD. FAX 
"a(i) = 777 = 0 (A.2) 


E, E) E 


Aunque el cociente de Rayleight depende de la matriz, el subíndice A de 
r se omite si no hay confusión. 


Teorema A.2 Sea A una matriz real diagonalizable de tamaño nxn. Sea 
%¡ ER” cualquier vector no nulo. Considérense los cocientes de Rayleigh: 


r(w,) = NE para A 07 


donde m es la cantidad deseada de ¡teraciones. El último cociente r(úr) 
es una aproximación del valor propio dominante A de A, y si se hace 
r (5) =A+e, de modo que e es el error de r(wy), entonces: 


le < E 20), (43) 


donde Y = AWr. 
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Demostración. 
Si se reescribe el cociente de Rayleigh, se obtiene que 


0 Atv =1 (y) 0, Wk, k=1,2. 0... 1H 
y dado que yy = A), se tiene que W/.Yj = r(6,) 01,0. Por lo tanto, 
[Ya — r (055) 157)" [Te — r (De) Ur] = Ye Un — 2r (Wi) DTi +1? (Uy) 04, Dn 


= UY — 1 (04) 040% 


= Dip. (A.4) 


Como AÁ es una matriz diagonalizable, por el Teorema 2.19 tiene n vec- 
tores propios linealmente independientes (41, U2,...,Un) correspondien- 
tes a los valores propios (A1,A2,..., An), respectivamente, y mediante 
el proceso de Gram-Schmidt se ortonormalizan estos vectores para obte- 
ner (%,,U2,...,Un) una base ortonormal de R”. Entonces, 4 tiene una 
representación de la forma 


n 
Wi = > C¡V; con Cc; ER, 
¿=1 


y como los Y, son vectores unitarios ortogonales, entonces 


n 

UU = dc. (A.5) 
¿=1 
Ahora bien, 
n n 
Uk = AWx = A C¡V; = > C¡A¡U; 
i=1 i=1 
Luego, 


Je — 1 (0) 0% =) 0]; — r (00%) 0. 


Si se reemplaza en (A.4), se obtiene que 


n 


ui = y ci [A; — r(15))?. 


i=1 
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Si se sustituye cada Di —- r(w,)]* por el menor de estos términos y se 
aplica (A.5), se tiene que 


n 
Ei > De —- r(%;)] e . dd = pe — r(155))] 5415, 
¿=1 


donde A. es un valor propio al cual r (5) está próximo. De esto se llega 
a (A.3), y queda demostrado el teorema. Ml 


A continuación, se presenta un procedimiento para obtener el valor propio 
dominante de una matriz A. 


Método de los cocientes de Rayleigh 


Sea A una matriz diagonalizable de tamaño n x n con un valor 
propio dominante. Sea m la cantidad deseada de iteraciones. 


i) Seleccione un vector arbitrario diferente de cero Wo. 
1i) Para k=0,1,...,m-—1, 
k 
[az] 
b) Sea +1 = AZh. 


a) Calcule Zj = 


c) Evalúe r(Zp) 0 A Úrsi: 


iii) Los cocientes de Rayleigh fr(2,)) tienden al valor propio 
dominante y la sucesión (2, ) se aproxima al correspondiente 
vector propio unitario. 


Para matrices simétricas, este método es muy eficiente y requiere 
menos iteraciones para lograr la misma exactitud. 


Ejemplo A.4 /llustrar el método de los cocientes de Rayleigh, para la 
matriz dada en el Ejemplo A.3 


A. Métodos iterativos 
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Solución. 
Aplicando el método de los cocientes de Rayleigh se obtiene la tabla 
siguiente: 
k 0 1 2 3 4 5 
1 1 7 41 247 
7 v2 v10 132 112290 1441698 0.37135 
Zk 1 3 1 103 617 0.92849 
v2 v10 13y2 112290 1141698 " 
3 7 41 247 1481 
añ El Ed Ei Ea] El Pl 
v2 v10 1342 v 12290 v141698 aso ON 
29 1019 36839 1325279 
Ap a 5 169 6145 220849 5.9997 


Así, el valor propio dominante es aproximadamente A = 6 y el res- 
ectivo vector propio unitario es Marido 
i e 0.92849| ' 


Ejercicios A.1 Determine los vectores propios dominantes con los mé- 
todos descritos en este apéndice para las siguientes matrices: 


1 1 b 1103 1 -1 
ali gl: le 41 cla 1 
132 3. 1 4 
d.|3 1 2]. e. 1. 1 3 


2.2 1 4-5 2 


Apéndice B 


Números complejos 


B.1 Álgebra de los números complejos 


Como el concepto de número complejo se utiliza con mucha frecuencia en 
este material y como algunos lectores quizás tengan solo un conocimiento 
superficial de ellos, este apéndice contiene un breve repaso de sus propie- 
dades algebraicas más importantes. 


Definición B.1 Número complejo 
Un número complejo es una expresión de la forma: 


z=a+bi, 


donde a y b son números reales: a se llama la parte real de z y se denota 
por Re(z) y b es llamado la parte imaginaria de z y lo denotamos por 
Im(z). El símbolo i se llama unidad imaginaria y satisface la propiedad 
de que 1? =-—1. 


Definición B.2 Igualdad de números complejos 

Dos números complejos a + bi y c+ di se definen como iguales si y 
solo si las partes real e imaginaria de uno son respectivamente iguales a 
las partes real e imaginaria del otro, esto es, si y solo si a =c y b= d. 


Definición B.3 Formas especiales de los números complejos 

Dado un número complejo de la forma z = a + bi, si b=0, se llama 
número real; por otra parte, si a = 0, se denomina número imaginario 
puro. 
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B.1.1 Operaciones fundamentales 


Definición B.4 Suma y diferencia 

La suma y diferencia de los números complejos a + bi y c+ di son 
definidas sumando o restando sus partes reales y sus partes imaginarias, 
como sigue: 


(a+ bi) + (c+ di) = (a+) + (b+ d)i, 
(a + bi) — (c+ di) = (a — c) + (b— d)i. 


Definición B.5 Multiplicación 
El producto de los números complejos a + bi y c+ di se define como 
sigue: 


(a + bi) - (c+ di) = (ac — bd) + (ad + be)i. (B.1) 


Teorema B.1 Un número complejo es igual a cero si y solo si sus partes 
real e imaginaria valen cero. 


Demostración. 
Queda como ejercicio para el lector. M 


Definición B.6 Inverso 
El recíproco o inverso del número complejo c+di se define como sigue 
c =d . cdi 
NN + 1= E 
O E 


(c+ di)” 


Puesto que c? y d? son no negativos, c? + d? =0 si y solo sic=d=0. 
Por lo tanto, el único número complejo c+ di que no tiene recíproco es 
el cero. 


Esta definición del recíproco nos lleva a la siguiente definición. 


Definición B.7 División 
Siw=a+bi,z=c+di y 2% 0, se puede definir su cociente como 


sigue: 
wo  _-1_(ac+bdy  (be=ady. 
y == (5) ESE la (B.2) 


el cual resulta ser un número complejo. 
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Teorema B.2 Los números complejos satisfacen las siguientes propie- 


dades: 
e Para la adición: 


A1. Sizi =a+bi y z2 = c+ di pertenecen a C, su suma 21 + 
zo pertenece a C. Esto también se expresa diciendo que € es 
cerrado bajo la adición. 


A?2. Ley Conmutativa: 21 + 22 = 29 + 21. 

AS. Ley Asociativa: (21 + 22) + 23 = 21 + (22 + 23). 

AJ. Elemento identidad: Existe un elemento 0 =0+0 en C tal 
que sizEC,2+0=z. 

AJ. SizE€C, existe un elemento único —z en C, llamado el nega- 
tivo de z, tal que z + (—-z) =0. 


e — Para la multiplicación: 


M1. Si zi =a+bi y z2 = c+ di pertenecen a €, su producto 
z1.Z2 pertenece a C. Esto también se expresa diciendo que € 
es cerrado bajo la multiplicación. 


M2. Ley Conmutativa: 21.29 = 29.21. 
MS. Ley Asociativa: (21.29).23 = 21.(22.23). 


M4. Elemento identidad: Existe un elemento 1 = 1+01 en C tal 
que l.z= z para todo z € C. 


M5. Si zH 0, existe un elemento único z7* tal que z.(27*) = 1. 


e Ley Distributiva: Esta última regla entrelaza la adición y la multi- 
plicación. 


Si 21, 22 y 23 pertenecen a C, entonces 
z1-(22 + z3) = (21.29) + (21.23). 


Demostración. 
Queda como ejercicio para el lector. M 


Definición B.8 Número complejo conjugado 
El conjugado de z es el número Z = a + bi = a — bi. 


Teorema B.3 La suma, diferencia y producto de números complejos con 
sus conjugados son, respectivamente, un número real, un número imagi- 
nario puro y un número real no negativo. 


462 B. Números complejos 


Demostración. 
Si z = a + bi, entonces z = a — bi y por lo tanto, 


2+273=20, z— Z =2bi y 23 =0 +0. 
H 


Teorema B.4 Si un número complejo es igual a su conjugado es un nú- 
mero real, pero si es igual al negativo de su conjugado es un número 
imaginario puro. 


Demostración. 

Si z = a + bi, entonces z = a — bi, luego si 2 = z, por la definición 
de igualdad se tiene que b= —b, así que b= 0, y por lo tanto z = a. Por 
otra parte, si z = —Z, por la definición de igualdad se tiene que a = —a, 


de modo quea=0y z¿=bi. mM 

Una aplicación importante del conjugado de un número complejo está 
en el cálculo de un cociente, la regla “multiplíquense numerador y deno- 
minador por el conjugado del denominador” es más fácil de recordar que 
la fórmula (B.2). En otras palabras, en el proceso de división 


Ml 1 z 
2 1 = E 
2 22 
y en forma análoga 
w R wW.Z 
— =w.zx *=—Á, 2 %0. 
Z ZzZ 


Teorema B.5 Propiedades de los números complejos conjugados 
Siw y z son números complejos, entonces 


(a) uv =w. (bl wtz=w=+R2. 
(c) 0.2 =0.zZ. (d) (w/z) =0/Z, siz 40. 
Demostración. 


(c) Si w= a+ bi y 2 = c+ di, entonces por (B.1) 


w.z = (a +bi).(c+ di) = (ac — bd) + (ad + be)i 
= (ac — bd) — (ad + be)i. 
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Mientras que 


w.z = (a + bi).(c + di) = (a — bi).(c — di) 
= (ac — bd) — (ad + bc)i. 


De modo que 


W.Z= W.Z. 
Procedimientos semejantes se aplican en los otros casos. Mi 


Definición B.9 Módulo 
El módulo o valor absoluto del número complejo z = a + bi, represen- 
tado por |z|, es la distancia desde el punto (a,b) al origen, es decir: 


Ed =Vz2. 23 = Va +02, 


Teorema B.6 Propiedades del módulo 
Siw y z son números complejos, entonces 


(a) [w| = |w]. (b) [w+ 2] < [tw] +2]. 
w hol. 
alla: d A = 
(c) [w.z| = |1].|z| (d) da F0 
Demostración. 


Sean w=a+biy 2 = c+ di, entonces 
(a) [w] = ya + (-b)* = |w)l. 
(b) Para probar esta, observemos que 


(w+2).(w+ 2) = (w+ 2). (w+2) 


= W.WH2Z.2Z+W2Z+uw.z, 


o bien 
[w +21? = [wi? + |21? + (w5.z + w.z) . 
Pero como 
w.z + w.z =2Re (w.z) < [w.z] = 2/w].|z), 
se tiene que 
[w +21? < [wj? +|21? + 200.12] = (lwo] + |21)?. 


Tomando raíz cuadrada en ambos miembros, se llega al resultado 
deseado: 
[rw +2] < [w] + |2/. 
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(c) La demostración consiste en un cálculo directo: 


[w.z| =|(a + bi).(c + di)| =|(ac — bd) + (ad + be)il 
= y (ac — bd)? + (ad + bc)? = y (a? + b2).(c2 + a?) 


= |w].|21. 


(d) Se deja la prueba para el lector. M 


Definición B.10 Argumento 

El argumento o amplitud del número complejo z = a+ bi es el ángulo 
formado por el segmento que va del origen al punto que representa un 
número complejo y el eje real positivo, y está dado por la expresión: 


0 =arg(z) =asctan (2) +2n77 m=0, El Ed 2 
= Arg(z2) +2nr, (B.3) 


donde Arg(z) denota el valor principal de arg(z) y se define como el único 
valor de arg(z) tal que —r < arg(z) < r. 


Teorema B.7 Propiedades del argumento 


Si w y z son números complejos, entonces 
(a) arg(w.z) =arg(w) + arg(z). 


(b) arg (%) =arg(w) — arg(z), si z 0. 


Demostración. 


Queda como ejercicio para el lector. M 


B.1.2 Representación polar 


Sean r y 0 coordenadas polares del punto (a,b) que corresponden a un 
número complejo no nulo z = a + bi. Vea la representación en la Figu- 
ra B.l: 
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Iml=) 


Figura B.1: Representación polar. 


Por tanto, 


a =rcosÓ = |z| cos (arg z) y  b=rsen0= |lz|sen (arg z). 


En consecuencia, z puede ser expresado en forma polar como 


2 =r(cos9 + ¿sen0) = |2| [cos(arg z) + ¿sen(arg z)). 


Esta representación polar de z es de gran utilidad para obtener potencias 


y raíces de números complejos. 


Definición B.11 Fórmula de Euler 


Sea 0 un número real. Se define el símbolo e'?, como sigue: 
10 . 
e” =cos0 +1send, 


esta ecuación se conoce como la fórmula de Euler. 


Teorema B.8 Teorema de De Moivre 
Siz= r (cos 0 + ¡sen 9), entonces 


2" =1”(cosn0 + ¿senn0) =|z/” [cos(narg 2) + ¿sen(narg 2)), 


donde n es cualquier número entero. 


Demostración. 
Queda como ejercicio para el lector. M 


(B.4) 


(B.5) 
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El teorema de De Moivre también puede utilizarse para encontrar las 
raíces m-ésimas de un número complejo. Si se hace n = Z, entonces 


1 1 l 
zm = [r (cos O + ¿sen 0)]m = rin cos( 70) + ison( Lo) | 
m m 
Además, si se tienen en cuenta las siguientes identidades trigonométricas 


cos(9 + 2kr) = cosÚ y sen (9 AS 2kr) = sen, 


en donde k es un entero, se tiene que 


1 


Ea £[r (cos (0 + 2k7r) + ¿sen (0 + 2k7))) 


"| (EE) ] (EE) 
= rm|cos| ——— | +2sen . 
m m 


Las raíces m-ésimas se obtienen asignando a k los m valores consecutivos 
enteros 0,1,2,...,m-— l. 


Observación. 
Si m = 2, se tiene que 


ve=wWVa Eb = 1h [cos (5 +Km) £isen( y +m)| k=0,1. 


Luego, 


Já lll ($) sison(9)| dl 


—|2|2 [cos (5) + ¿sen (5) si k= 1 


Si se usan las siguientes identidades trigonométricas 


ON _ /1+c0s8 ON _ /1-cosó 
basis! 071 Vol E y sen 5) =Y —3 > 
se llega a 
2 
rua Llar +sen(o) Va=TH].  k=0,1, (BS) 


donde sgn(-) denota la función signo. 


Ejemplo B.1 Si z =a + bi, demuestre que 


VZ+vVz= 2 (a +]2|). 
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Solución. 
Si z = a + bi, entonces zZ = a — bi. Por lo tanto, 


(Vz + vay =2 252/22. 


Por el teorema B.3, se tiene 


(Vz+vVZ) =20.+2ya2 +02. 


Al tomar raíz cuadrada a ambos lados, se obtiene 


Va vV3=% y/2(a E [2], 


y la prueba queda completa. 
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de Sarrus, 12 
Rotación de ejes 
en R?, 277 
en R?, 290 


Seudoinversa, 364 
Sistema de ecuaciones 
de mal comportamiento, 324 
lineales, 56 
consistente, 57 
homogéneo, 57 
inconsistente, 57 
Submatriz 
angular, 29 
principal, 28 
Suma 
de subespacios, 45 
directa, 46 
Superficie 
cuádrica, 284 


Teorema 
de Cayley-Hamilton, 149 
de Cochran, 345 
de De Moivre, 465 
de Euler, 261 
de los ejes principales, 256 
de Schur, 210 


espectral 
para matrices simétricas, 113 


Transformación 


biyectiva, 61 

lineal, 59 
representación matricial, 59 
sobre, 61 
uno a uno, 60 

ortogonal, 277 


Transpuesta 


de una matriz, 6 
conjugada, 63 
particionada, 30 
propiedades, 6 


Traza 


de una matriz, 9 


Valor 


característico, 70 

propio 
dominante, 451 

singular, 186 


Vector(es) 


característico, 70 
complejo, 66 
linealmente 
dependientes, 46 
independientes, 47 
probabilístico, 412 
propio 
dominante, 451 
generalizado, 115 


El álgebra de matrices es, en la actualidad, 
un elemento fundamental de los conoci- 
mientos matemáticos para ingenieros y 
científicos; además, la comprensión de 
sus métodos fundamentales, es de gran 
utilidad para sociólogos, economistas, 
estudiantes de pedagogía y de ciencias 
económicas. 

Sin embargo, a pesar de las diversas 
aplicaciones del álgebra matricial, la 
mayoría de textos de álgebra lineal no las 
introducen y en muchos casos, no se 
encuentra un libro que se ajuste a los 
requerimientos y necesidades de ciertas 
disciplinas. El presente libro busca 
solucionar esta necesidad, capacitando al 
lector para que adquiera la habilidad de 
usar el álgebra de matrices en diferentes 
ámbitos de forma práctica y concisa. 


